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l.Pendahuluan 


Sesuai dengan perkembangan pengetahuan yang tidak ada 
kesudahannya, demikian juga dengan perkembangan dari metoda atau 
tatacara untuk interpretasi data. Bila semula hanya cukup dengan 
memperhatikan satu peubah atau karakter saja dari satu individu, 
sekarang berkembang dengan memperhatikan dua bahkan lebih 
banyak lagi peubah yang merupakan karakter dari individu yang sama. 
Seperti pengamatan pada padi, yang semula hanya memperhatikan 
produktivitasnya saja, kemudian berkembang dengan memperhatikan 
umur dan tinggi tanaman, sehingga diperoleh tanaman yang lebih 
pendek umur dan tingginya namun menghasilkan produktivitas yang 
tinggi. Berkembang lagi dengan memperhatikan rasa, warna, dan 
tempat tumbuh. Sehingga diperoleh padi yang sesuai di semua tempat 
atau hanya sesuai ditempat tertentu saja. Secara umum, karena 
merperhatikan banyak karakter dari individu yang sama, akan ada saling 
ketergantungan atau inter dependensi antar karakter yang diamati, atau 
dikenal dengan saling berkorelasi. Keadaan itulah yag menjadi fitur yang 
dapat membedakan antara peubah ganda dan peubah tunggal. 

Buku ini ditulis terutama untuk menyediakan tehnik pengolahan data 
peubah ganda bagi para ilmuwan hayati yang pengumpulan datanya 
diperoleh dari suatu perancangan percobaan. Meskipun dapat juga 
digunakan untuk para ilmuwan dari bidang lain dengan penyesesuaian 
seperlunya. Sebagai pengantar ke analisis peubah ganda, materi yang 
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dicakup akan meliputi manova, analisi profil, analisis komponen-utama, 
analisis faktor, analisis gerombol, analisis diskriminan, analisis biplot, analisis 
korespondensi, analisis kanonik, analisis regresi peubah ganda, model 
persamaan berstruktur, penskalaan berdimensi ganda, dan analisis 
konjoin, disamping review aljabarmatriks. 

Buku ini disusun dalam 17 bab dan disusun sebagai buku pegangan untuk 
mata-ajaran sidik peubah ganda bagi mahasiswa SI pada tahun ke tiga 
atau mahasiswa S2 tahun pertama mayor statistika di Departemen 
Statistika, Fakultas Matematika dan IPA, IPB. Bagi mahasiswa SI, sampai 
dengan Bab 3 wajib dimengerti dengan baik sebelum mempelajari Bab 
lainnya. Bab 12 sampai Bab 17 adalah topik yang wajib diketahui bagi 
mahasiswa S2, sedangkan bagi mahasiswa SI baik untuk diketahui akan 
tetapi diberikan sebagai pengetahuan tambahan saja. Dalam 
mempelajari buku ini, meskipun akan ada pengulangan untuk beberapa 
materi peubah tunggal seperlunya, tetapi untuk memperoleh hasil yang 
lebih baik, pembaca diharapkan telah mendapat pengetahuan satu 
semester untuk mata-ajaran metoda statistika, sampling, dan kalkulus, 
terutama tentang turunan sebagian dan integral, yang diperlukan untuk 
menghitung maksimum dan nilai harapan. Akan lebih baik lagi bila telah 
mempelajari aljabar matriks. 

Kami berterimakasih pada Saudara Alfian dan Adhi, mahasiswa S3, yang 
telah membantu kami mengedit buku ini dengan seksama. 
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2.Review Aljabar Matriks (Matrix Algebra Review ) 


2.1. Pendahuluan 

Pada beberapa bidang ilmu dan bidang terapan, seperti sosiologi, politik, 
ekonomi dan keputusan-keputusan bisnis, sebagian besar informasi 
diperoleh dari hasil analisis data. Seringkali data yang tersedia sangat 
besar, sehingga jika langsung diintrepetasikan akan cukup menyulitkan, 
kecuali dilakukan dulu tahapan peringkasan dan interpretasi yang sesuai. 
Seringkali juga, analisis yang tepat tidak dapat hanya mengandalkan 
perhitungan sederhana seperti rata-rata saja. Semakin kompleks struktur 
datanya, kebutuhan data analisis yang lebih konperhansip juga 
diperlukan. 

Kerumitan dari sebuah gugus data muncul karena beberapa alasan. 
Misalnya saja, gugus data tersebut mungkin mengandung banyak sekali 
objek amatan yang aneh dan keberadaannya tidak dapat dijelaskan 
secara sederhana. Amatan seperti itu sering disebut sebagai amatan 
berpengaruh atau pencilan. Menentukan apakah sebuah amatan 
berpengaruh atau tidak adalah sesuatu yang cukup sulit. Pendekatan 
formal dan grafik dapat dilihat pada berbagai literatur. 

Situasi lain dimana analisis sederhana yang hanya mengandalkan rata- 
rata dapat jadi tidak mencukupi adalah ketika data pada beberapa 
peubah saling berkorelasi dan/atau berpola. Situasi seperti ini sering 
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muncul pada pengamatan deret waktu. Misalnya, jika data dikumpulkan 
dari seorang atau sekelompok pasien dengan perlakuan tertentu, kita 
jarang tertarik mengetahui rata-rata respon dari waktu ke waktu. Yang 
lebih menarik adalah mengamati perubahan nilainya, yaitu mengamati 
pola atau trend-nya. 

Tidak jarang, data dikumpulkan dari sejumlah unit objek, dan di setiap 
objek tidak hanya satu amatan, tapi banyak peubah yang diukur. 
Sebagai contoh, dalam percobaan psikologi, banyak pengujian 
dilakukan terhadap setiap individu. Karena pengukuran-pengukuran 
(melalui tes) dilakukan pada individu yang sama, maka pengukuran- 
pengukuran tersebut saling berkorelasi dan pada saat melakukan 
peringkasan terhadap data maka informasi korelasi ini harus menjadi 
bagian yang tak terpisahkan dari hasil ringkasan. Lebih jauh, ketika 
banyak sekali peubah yang terlibat untuk mendapatkan informasi yang 
lebih jelas dan lebih mudah, ringkasan tentang korelasi ini mutlak 
diperlukan. Serta masih banyak lagi hal-hal yng membuat data menjadi 
lebih kompleks untuk di analisis. 

Secara umum, kita memiliki n buah amatan dan di setiap amatan 
dilakukan pengukuran p buah karakteristik (peubah), katakanlah xi, X 2 , ..., 
x p . Selanjutnya data tersebut dapat digambarkan sebagai matriks n x p 



Tentu saja, pengukuran pada baris ke-/, yaitu xn, Xi 2 , ..., Xi P yang 
merupakan pengukuran pada individu yang sama, saling berkorelasi. Jika 
kita menyusun pengamatan tersebut sebagai vektor baris Xi diperoleh 
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Xi J/l ’ X i2 ’ ’ X ip J 

maka Xi dapat disebut sebagai pengamatan peubah ganda. Dengan 
demikian, n baris pada matriks X berpadanan dengan n buah 
pengamatan peubah ganda, dan pengamatan pada setiap Xi umumnya 
saling berkorelasi. Sementara itu, antara xi, X 2 , ..., x n dapat berkorelasi, 
dapat juga tidak. Umumnya diasumsikan bahwa antar amatan xi, X 2 , ..., 
x n tidak berkorelasi (saling bebas sebagai asumsi yang lebih kuat), namun 
ini tidak selalu terjadi. Misalnya saja jika Xi adalah pengukuran tinggi dan 
berat anak ke-i dari sebuah keluarga n orang anak, maka sangat masuk 
akal jika antar baris pada matriks X memiliki korelasi. 

Pada buku ini, kita tidak melakukan pembahasan untuk kasus adanya 
korelasi antar baris matriks X, dengan kata lain diasumsikan baris-baris 
matriks X berpadanan dengan satuan contoh yang diambil secara bebas 
stokastik. 

2.2. Populasi versus Contoh 

Seperti telah dibahas sebelumnya, n buah baris pada matriks X 
menggambarkan n buah amatan peubah ganda. Jika gugus dari n buah 
ini berpadanan dengan keseluruhan unit yang mungkin, maka data yang 
tersedia adalah data populasi. Sebagai teladan, data dikumpulkan dari 
seluruh kota di Bogor yang memiliki populasi satu juta atau lebih orang, 
dan diukur tiga peubah misalnya biaya hidup, rata-rata gaji per tahun, 
dan kualitas fasilitas kesehatan. Karena setiap warga Bogor yang 
memenuhi definisi termasuk di dalam data tersebut, maka hasil ringkasan 
data itu akan menjadi ringkasan populasi yang sesungguhnya. 

Tetapi lebih sering data diperoleh dari hasil survei dan dari setiap objek 
survei diamati p buah peubah. Situasi ini menggambarkan contoh 
peubah ganda. Sebuah contoh (baik cukup atau tidak) merupakan 
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perwakilan dari populasi tertentu. Karena populasi hanya diwakili oleh 
sebagian unit yang terpilih, maka hasil ringkasan terhadapnya diharapkan 
mewakili nilai yang sebenarnya dan diharapkan mendekati nilai tersebut, 
meskipun tidak ada jaminan yang pasti. 

Bagaimana caranya mengukur dan memastikan bahwa hasil ringkasan 
dari contoh akan merupakan perwakilan yang baik bagi ringkasan 
populasi? Untuk hal tersebut, berbagai jenis indeks berbasis konsep 
peluang digunakan. Hal ini mengharuskan seseorang untuk membangun 
suatu struktur peluang pada setiap amatan. Ide ini diimplementasikan 
dengan memasukkan struktur peluang pada skema pengambilan contoh, 
baik secara artifisial maupun sesungguhnya. Tentu saja, jika kita ingin 
memastika contoh kita adalah wakil yang baik bagi populasi, maka 
struktur peluang yang dibuat adalah sedemikian rupa sehingga perlakuan 
terhadap seluruh unit populasi sama (equolly f air). Sehingga, kita perlu 
melakukan pengambilan contoh dengan memberikan peluang yang 
sama bagi setiap unit untuk terpilih sebagai unit contoh. Persyaratan ini 
dapat terpenuhi dengan melakukan pengambilan contoh secara acak. 

Meskipun struktur peluang diperkenalkan terhadap unit penagamatan 
melalui penarikan contoh acak, tidak demikian halnya dengan p buah 
pengukuran. Antar pengukuran itu sendiri memungkinkan adanya 
keterkaitan, sehingga muncul istilah sebaran peluang bersama. Jadi, kita 
memandang baris-baris matriks X sebagai pengamatan peubah ganda 
dari populasi berdimensi-p yang mewakili sebaran peubah ganda 
berdimensi-p. Dengan kata lain, baris-baris X adalah contoh acak dari 
populasi berdimensi-p. Dalam banyak analisis, seringkali populasi 
diasumsikan tidak terhingga dan diasumsikan memlikiki sebaran normal 
ganda. 
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2.3. Beberapa alat dasar untuk memahami data 
peubah ganda 

Untuk memahami data yang besar dan peubah-peubahnya tidak saling 
bebas, peringkasan tetap harus dilakukan. Untuk data univariote (satu 
peubah yang menjadi fokus pembahasan), peringkasan umumnya 
dilakukan menggunakan rata-rata, ragam, kemenjuluran, dan kurtosis, 
baik untuk populasi maupun contoh. Data peubah ganda juga memiliki 
hal yang serupa. Pada tulisan ini, notasi matriks akan banyak digunakan 
untuk menyederhanakan penulisan. Beberapa istilah matriks akan 
dibahas kemudian. 

Misalnya x adalah vektor acak berukuran p x 1 yang berpadanan 
dengan sebuah populasi peubah ganda, atau 



maka setiap Xi adalah peubah acak, dan kita mengasumsikan xi, ..., x p 
mungkin saling tidak bebas. Notasi E() menunjukkan nilai harapan 
(diinterpretasikan sebagai rata-rata dalam jangka panjang), dan misalkan 
pii = E(xi) dan an = var(xi) adalah ragam populasi. Selanjutnya peragam 
populasi antara Xi dan Xj adalah o\\ = cov(xi, Xj). Didefinisikan vektor rataan 
populasi (m) sebagai vektor dari nilai harapan setiap peubah, yaitu: 


E(x) 


~E( X y 


Mi 

_E(x p )_ 
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Sebagai tambahan, konsep ragam populasi dirangkum dalam sebuah 
matriks yang memuat ragam dan peragam populasi yang diletakkan 
bersesuasian dalam matriks ragam-peragam. Jika matriks tersebut 
dilambangkan E, maka 


cov(x 1 ,x 2 ) 


COV(X|, X p ) 

) var(x 2 ) 


cov(x 2 ,x p ) 

) cov(x /) , x 2 ) 


var(x p ) 

^11 & 12 



<J 2\ ®22 



°pl Cr /»2 

a pp_ 



Dengan mengartikan cov(xi, Xi) = var(xi) = an , bentuk cov(xi, Xj) dapat 
disebut sebagai unsur ke-f/, j) dari matirks E. Nilai-nilai ragam peubah ke-/ 
ditempatkan pada diagonal utama ke-/, dan nilai peragam akan 
ditempatkan bersesuaian pada unsur non-diagonal. Karena cov(xi, Xj) = 
cov(xj, Xi) atau o\\ = aji , maka E merupakan matriks yang simetrik. 

Nilai tr(E) = 'V 7 cr,, disebut sebagai ragam total dan det(E) = |E| 

disebut sebagai ragam terampat (generalized variance). Dua buah nilai 
tersebut seringkali digunakan sebagai ukuran keragaman total dari vektor 
acak x. Namun demikian, kadang-kadang penggunaannya dapat 
menyesatkan, sebgai misal, tr(E) sama sekali tidak memperhitungkan nilai- 
nilai selain diagonal utama yang menunjukkan peragam antar peubah. 
Atau dapat juga, dua buah matriks yang sangat berbeda mungkin 
memiliki determinan yang sama. 
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Karena ada keterkaitan antara Xi, ..., x p maka masih relevan jika kita 
melihat tingkat keterkaitannya, palingtidak keterkaitan linearnya melalui 
besarnya korelasi. Koefisien korelasi Pearson untuk populasi antara Xi dan 
Xj diperoleh melalui 


CO _ CTy 

Vvara,) var(x y ) 

Selanjutnya kita definisikan matriks korelasi populasi sebagai 


Ai 

P12 

•• a/ 


" 1 

A 2 

•• a/ 

Ai 

Pil 

P 2 p 

= 

Ai 

1 • 

Plp 

P p i 

Pp2 

P pp _ 


_Ai 

A>2 • 

•• 1 


Seperti halnya E, p juga meupakan matriks simetirk. Lebih jauh, p dapat 
dituliskan dalam E sebagai 


p = \iag{ E) ”2 E fiagCL) ~2 

dengan diag(E) adalah matriks diagonal yang didapatkan dengan 
mempertahankan unsur diagonal E dan mengganti unsur non- 
diagonalnya dengan 0, dan akar kuadrat dari matriks A dinotasikan A 1/2 
adalah matriks yang memenuhi A = A 1/2 A 1/2 , dan A- 1/2 adalah invers 
(kebalikan) dari matriks A 1/2 . Pada buku ini diasumsikan matriks ragam- 
peragam dan matrik korelasi bersifat definit positif. 

Bagaimana kita mengukur kemenjuluran ( skewness ) dan kurtosis untuk 
populasi peubah ganda? Mardia (1970) mendefinisikan ukuran ini 
sebagai: 
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multivariate skewness : (3i, P = £ |x-^i) f L^(y-^i) 3 dengan x 

dan y saling bebas dan dari sebaran 
yang sama. 

kurtosis multivariate : (32, P = E |x — ji) T Z _1 (x — \i) 2 . 

Untuk kasus univariate, yaitu p = 1, (3i, P menjadi kuadrat dari koefisien 
kemenjuluran, dan (32 /P adalah koefisien kurtosis. 

Besaran-besaran p, E, p, (3i /P , dan |32, P merupakan nilai-nilai ringkasan dasar 
bagi populasi peubah ganda. Lalu, apa padanan dari besaran-besaran 
ini untuk contoh? Jika kita memiliki contoh acak berukuran n yang terdiri 
atas p buah peubah xi, ..., x n , maka didefinisikan matriks X yang 
berukuran nxp 


x i 


X 


nx P — 


X 


n 


padanan besaran di atas adalah: 


n 

vektor rataan contoh : x = n~ x 'V x, = ?z _1 X f l 

i =1 


: S = (n- 1) _1 J](x ; -x)(x,. -x)' 

1=1 
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matriks ragam-peragam contoh 



= (n-1)- 1 H'(I-n- 1 l„l„)X 


= (n-1)" 1 ^X-n-'Xl„i;X 
= (n-1)" 1 5f X-//xx' ' 

Seringkali juga disebutkan dalam beberapa literatur bahwa pembagi 
pada persamaan di atas adalah n bukan (n - /J. Jika demikian halnya 
maka notasi yang digunakan adalah S n . Kita juga masih memiliki 
beberapa besaran, yaitu: 

matriks korelasi contoh : p = |?zag(S)_2S ^iag(S) 2 

= t ia 8( S„) "iS„ \iag(S n )J 

n n 

skewness contoh peubah ganda : /?, p - n > 

i= 1 7=1 

dan 

/V - U 

kurtosis contoh peubah ganda : /3 2p - n 2 ^ g 2 . 

/=i 

Pada persamaan-persamaan di atas, l n adalah vektor kolom berukuran n 
x 7 dengan seluruh unsur bernilai 1, l n adalah matriks identitas berukuran n 
x n, dan g,y, /, j = 1, 2, ..., p, didefinisikan sebagai g,y = 

(x,- -x)'S- 1 (x. -x). 
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2.4. Pereduksian Data, Pendeskripsian, dan Pendugaan 


Pada bagian sebelumnya telah dibahas beberapa besaran penciri dasar 
populasi dan padanannya untuk contoh, yang biasa disebut statistik 
deskriptif. Ide dasarnya adalah merangkum data populasi atau data 
contoh menjadi matriks yang lebih kecil ukurannya atau menggunakan 
angka-angka sederhana. Semua besaran-besaran tadi (kecuali korelasi) 
hanya merupakan padanan besaran yang sama pada kasus univariate. 
Namun demikian, data peubah ganda memiliki ciri dan kebutuhan yang 
khas, yang tidak ada pada situasi univariate. Meskipun ide dasarnya 
tetap sama, yaitu meringkas atau mendeskripsikan data, situasi tertentu 
mungkin memerlukan teknik yang khas. Beberapa teladan untuk itu 
antara lain: 

a. Berdasarkan beberapa peubah (variabel) seperti rata-rata harga 
rumah, biaya hidup, kelengkapan fasilitas kesehatan, tingkat 
kriminalitas, dan sebagainya, kita ingin mendeskripsikan kota-kota 
mana saja yang sesuai untuk kelayakan hidup tertentu dan 
mengamati adanya kesamaan dan perbedaan antar kota. Ada 
beberapa peubah yang diukur, dan antar peubah mungkin saling 
bertolak belakang. Sebagai misal, kota yang rendah tingkat 
kejahatannya (karakteristik yang diinginkan) cenderung memiliki 
biaya hidup yang tinggi (karakteristik yang tidak diinginkan), jadi 
keduanya saling bertolak belakang. Bagaimana kita menentukan 
kota mana yang paling baik untuk ditinggali? Ini adalah masalah 
pereduksian data. Masalah ini tidak dapat dipandang sebagai 
penyeleksian peubah karena tidak ada peubah tak bebasnya dan 
tidak ada model, serta tidak dapat dipandang sebagai masalah 
pendugaan. Permasalahan ini lebih mendekati upaya pendeteksian 
dan pemahaman karakteristik yang terkandung pada data, dan 
kemudian menginterpretasikannya. Situasi ini memerlukan beberapa 
pendekatan untuk mendeskripsikan data. Analisis yang mungkin 
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dapat digunakan adalah analisis komponen utama atau analisis 
gerombol. 

b. Misalkan kita memiliki beberapa peubah bebas yang dicurigai 
memiliki pengaruh terhadap beberapa (banyak) peubah tak bebas. 
Situasi seperti ini seringkali ditemui pada bidang industri dan ekonomi, 
dimana dua gugus peubah dapat didefinisikan secara tegas dan 
memuat peubah input dan output. Kita tidak tertarik pada masing- 
masing peubah, tapi kita ingin memperoleh lebih sedikit peubah 
baru pada setiap kelompok peubah. Peubah baru ini mungkin saja 
dalah fungsi dari semua peubah asal pada masing-masing 
kelompok, dan berharap peubah baru ini dapat diinterpretasikan 
dengan tepat. Kita harus menekankan bahwa analisis ini tidak 
dilakukan dengan tujuan untuk membuktikan atau menyanggah 
pernyataan tertentu. Ini hanyalah upaya untuk memahami data. 
Karena informasi telah terangkum pada pubah yang baru, dan 
jumlahnya lebih sedikit, maka keterkaitan yang ada diharapkan lebih 
mudah untuk dilihat. Permasalahan ini antara lain dapat ditangani 
oleh analisis korelasi kanonik, dan analisis korespondensi untuk data 
kualitatif (kategorik). 

c. Sebuah perusahaan mobil ingin mengetahui apa yang menentukan 
pilihan konsumen pada berbagai mobil. Contoh acak 100 orang 
yang terpilih diminta untuk memberikan skor antara 1 (rendah) 
hingga 10 (tinggi) pada 6 peubah, yaitu harga, ketahanan, simbol 
status bekenaan dengan mobil, konsumsi bahan bakar, keamaan 
ketika kecelakaan, dan rata-rata jarak tempuh per minggu. Analsis 
jenis apa yang dapat digunakan untuk hal seperti ini? Dengan 
mengasumsikan adanya peubah hipotetik dan tak teramati yang 
mempengaruhi skor dari keenam peubah tadi, pertanyaan yang 
muncul adalah peubah hipotetik apakah itu. Secara intuitif, 
keamanan dan sisi status ekonomi dapat menjadi dua hal yang 
mempengaruhi skor-skor tadi. Jadi, beberapa atau semua peubah 


14 




yang teramati dapat dituliskan sebagai fungsi dari dua peubah 
hipotetik. Atau mungkin pertanyaan dibalik, apakah peubah yang 
tak teramati merupakan fungsi dari peubah yang teramati. Analisis 
faktor dapat dijadikan pilihan untuk kasus yang demikian. Sebagai 
catatan, analisis ini hanya memberikan fungsi, pemaknaan terhadap 
peubah yang tak teramati ditinggalkan sebagai bagian untuk analis. 
Jadi, permasalahan ini juga merupakan pereduksian dari banyak 
peubah menjadi sedikit peubah. 


2.5. Konsep-Konsep Aljabar Matriks 

Sub-bab ini dimaksudkan hanya sebagai ulasan singkat beberapa konsep 
aljabar matriks. Kami mengasumsikan bahwa para pembaca sudah tidak 
asing dengan operasi penjumlahan, penggandaan, dan pemutaran 
matriks. Serta beberapa konsep dasar seperti kebebasan linear. 

2.5.1. Matriks Putaran 

Untuk matriks A berukuran mxn, putaran dari matriks A diperoleh dengan 
cara menukar baris dan kolomnya, dan dinotasikan A’ berukuran n x m. 
Dalam notasi jika A = (a,y) dan putarannya adalah A’ = ( o\i ) maka a| = o’f,. 
Sebagai teladan, jika 







"i 

7" 


'i 

3 

4' 



0 

A = 

7 

0 

1 

maka A’ = 

3 







4 

1 


Juga untuk matriks A berukuran mxn, dan B berukuran n xr, berlaku 

(AB)’ = B’A’. 
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2.5.2. Matriks Simetrik 


Sebuah matriks A berukuran n x n dikatakan simetrik jika A' = A. Sebagai 
teladan 


A = 


7 

8 

-3 


8 

0 

1 


-3 

1 

9 


adalah matriks simetrik. Jelasnya, jika a, y adalah unsur ke-f/, j) dari matriks 
A, maka untuk matriks simetrik ciij = a p, untuk semua i dan j. Dalam banyak 
analisis statistik peubah ganda, nantinya kita akan sering berhadapan 
dengan matriks ragam-peragam, s, dan matriks korelasi, p, yang 
keduanya adalah matriks simetrik karena a / = ay/ dan pj = p,,. 


2.5.3. Matriks Diagonal 

Sebuah matriks A berukuran n x n disebut matriks diagonal jika semua 
unsur non-diagonalnya bernilai 0. Matriks diagonal tentulah matriks yang 
simetrik. Contoh matriks diagonal adalah 


A = 


7 

0 

0 


0 

0 

0 


0 

0 

9 


Pada situasi tertentu digunakan notasi diag(A), yang berarti sebuah 
matriks yang mempertahankan unsur-unsur diagonal A dan mengganti 
unsur non-diagonal dengan 0. Jadi untuk 
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" 7 

8 

-3' 


'7 

0 

0 " 

8 

0 

1 

, maka diag(A) = 

0 

0 

0 

-3 

1 

9 


0 

0 

9 


2.5.4. Beberapa Matriks Khusus 

Terdapat beberapa matriks yang memiliki ciri-ciri tertentu dilihat dari unsur 

dari matriks tersebut, antara lain: 

a. Matriks diagonal berukuran n x n dengan semua unsur diagonalnya 
bernilai 1 dan unsur non-diagonalnya bernilai 0 disebut sebagai 
matriks identitas. Notasi yang digunakan adalah l n atau disingkat I 
jika sudah jelas ukurannya. 

b. Matriks berukuran m x n dengan seluruh unsurnya bernilai 0 disebut 
matriks nol. Biasanya dinotasikan 0 m ,n atau disingkat 0. 


2.5.5. Matriks Segitiga 

Sebuah matriks A berukuran n x n disebut matriks segitiga atas jika semua 
unsur di bawah diagonal utama bernilai 0. Sedangkan matriks diagonal 
bawah adalah matriks yang semua unsur di atas diagonal utama bernilai 
0. Sebagai contoh. 



"1 1 9" 


"1 0 0 " 

Ai = 

0 3 4 

0 0 4 

adalah matriks segitiga atas, sedangkan A 2 = 

0 3 0 

0 3 9 


adalah matriks segitiga bawah. Dalam banyak operasi aljabar, pelibatan 
matriks segitiga akan mempermudah proses perhitungan (seperti 
pencarian determinan, akar ciri, penyelesaian sistem persamaan linear) 
sehingga mempercepat proses numerik yang dilakukan. 
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2.5.6. Kebebasan Linear 


Segugus vektor kolom (atau baris) tak nol dikatakan bebas linear jika tidak 
ada satupun yang dapat dituliskan sebagai kombinasi linear dari 
beberapa atau semua vektor lainnya. Jika hal ini tidak terjadi maka 
gugus tersebut dikatakan tak bebas linear. Gugus yang mengandung 
vektor nol selalu merupakan gugus tak bebas linear. 

Dalam notasi, segugus vektor S = {sl, ..., sm} dikatakan gugus yang bebas 
linear jika untuk semua Si, / = /, ..., m, tidak ada yang memenuhi 

s i = ; ai cdalah konstanta 

& j 

Dapat juga ditunjukkan bahwa ungkapan di atas setara dengan 
mengatakan S = {si,..., s m } dikatakan gugus yang bebas linear jika 

m 

I>A =0 

i =1 

terjadi hanya jika semua a/ = 0, t - L ..., m. 

Jika ada gugus vektor yang tak bebas linear, dan kita membuang vektor 
nol, kemudian melanjutkan dengan membuang vektor-vektor yang dapat 
dinyatakan sebagai kombinasi vektor lainnya, maka kita akan 
mendapatkan gugus yang bebas linear atau mungkin juga kita dapatkan 
gugus kosong. Banyaknya vektor pada hasil akhir yang tersisa tadi 
merupakan salah satu konsep penting yang akan dibahas selanjutnya. 
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2.5.7. Pangkat Matriks 

Pangkat dari sebuah matriks A, dilambangkan r(A) didefinisikan sebagai 
banyaknya baris (atau kolom) pada matriks itu yang bersifat bebas linear. 
Dalam hal ini kita dapat bekerja pada baris atau kolom, sehingga jelas 
bahwa r(A) = r(A’). Lebih jauh, dapat juga ditunjukkan bahwa r(AB) < min 
{r(A), r(B) }, dan r(A’A) = r(A). 


2.5.8. Matriks Non-Singular dan Matriks Singular 

Sebuah matriks A berukuran nxn dikatakan non-singularjika semua baris 
(atau kolom)-nya saling bebas linear. Dengan kata lain, A berukuran n x n 
non-singular jika r(A) = n. Jika satu atau lebih baris (atau kolom) A dapat 
dituliskan sebagai kombinasi linear dari beberapa atau semua baris (atau 
kolom) lainnya dari A, maka ada ketakbebasan linear diantaranya. Pada 
kasus ini, A dikatakan singular. Sebagai teladan 


A = 


i 

9 


3 

4 


adalah non-singular karena tidak satupun baris yang dapat dituliskan 
dalam bentuk baris yang lain. Tetapi 


B = 


1 

9 

11 


3 

4 

10 


4 

3 

11 


adalah singular karena baris 3 = 2 x barisi + baris 2 , yang menunjukkan 
bahwa baris ke-3 dapat dituliskan dalam bentuk kombinasi dua baris 
lainnya. 
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2.5.9. Kebalikan Matriks Persegi 

Sebuah matriks A berukuran n x n memiliki kebalikan jika ada matriks B 
sehingga AB = BA = l n . Matriks B disebut sebagai kebalikan matriks A, dan 
dinotasikan A -1 . Sebagai misal, 


1 3 
9 4 


matriks A' 1 adalah 


A A 

" 23 23 

_9_ _J_ 

23 23 


Jelas bahwa kebalikan dari A' 1 , yaitu (A' 1 )- 1 , adalah A. Matriks kebalikan 
hanya didefinisikan pada matriks berukuran n x n, yaitu jika banyaknya 
baris dan kolom sama. Untuk matriks demikian, kebalikan ada jika dan 
hanya jika A non-sisngular. Jadi, matriks kebalikan tidak dimiliki oleh 
matriks yang singular, atau matriks yang banyaknya baris dan kolomnya 
tidak sama. Untuk matriks seperti itu, ada konsep yang lebih lemah yaitu 
kebalikan umum kondisional, atau conditional inverse. 

Jika ada dua buah matriks A dan B berukuran n x n dan non-singular, 
maka (AB)-' dan (BA)-' ada, walaupun tidak sama. Secara khusus, 

(AB)-' = B ' A-' 


dan 


(BA)-' = A ' B ' 
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Karena sifat komutatif tidak berlaku pada penggandaan maka (AB)-' dan 
(BA)-' tidak sama. 

2.5.10. Kebalikan Umum 

Untuk sebuah matriks B berukuran m x n, matriks kebalikan umum 
kondisional bagi B, misalkan G adalah matriks berukuran n x m yang 
memenuhi 


BGB = B 

Secara umum, matriks kebalikan umum kondisional ini selalu ada, namun 
tidak bersifat unik (khas). Matriks kebalikan umumkondisiona ini bersifat 
unik untuk matriks non-singular, dan pada kasus ini sama dengan matriks 
kebalikan biasa. Matriks kebalikan umum bagi B dinotasikan dengan B\ 

Matriks 


B = 


I 3 

9 4 

II 10 


4 

3 

11 


sudah ditunjukkan bersifat singular. Matriks kebalikan umum bagi B 
adalah 


_4 

23 

9_ 

23 

0 


23 

J_ 

"23 

0 


0 

0 

0 


Tentu saja B- di atas bukan satu-satunya. 
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2.5.11. Sistem Persamaan Linear 


Misalkan sebuah sistem terdidri atas n buah persamaan dengan m 
peubah tak diketahui, x?, ..., x m , yang konsisten, yaitu sistem yang tidak 
memiliki anak gugus persamaan yang tidak bertentangan dengan 
persamaan sisanya. 

OllXl +012X2+ ... + OlmXm = bl 
021 Xl + 022X2 + ... + 02mXm = bl 


OnlXl + On2X2 + ... + OnmXm = bn 


Dengan mendefinisikan 



a n ■ 

•• a u„ 


i - 

i _ 

A = 



II 

n 



1 

a 

s 

■ ■ a 

nm _ 


_K_ 


persamaan di atas dapat dituliskan sebagai berikut: 

Ax = b 

Jika m = n dan matriks A non-singular, maka solusi untuk x diberikan oleh x 
= A^b. Jika m = n dan jika A bersifat singular (pada kasus dimana 
beberapa persamaan redundan karena sudah tercakup pada 
persamaan-persamaan lain) atau jika m * n, maka solusi bagi x adalah x 
= A'b, dimana A- adalah matriks kebalikan umum kondisional bagi A. 
Karena matriks kebalikan umum kondisional tidak unik kecuali pada A 
yang non-singular, maka pada kasus ini tidak diperoleh solusi yang unik 
untuk sistem persamaan tersebut. Alasannya adalah dengan memilih 
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matriks kebalikan umum yang lain maka akan diperoleh solusi yang 
berbeda pula. 

Ketika A non-singular, banyaknya solusi tak hingga, dan kesemuanya 
terangkum pada persamaan x = Ah + (I - A-A)z, dengan z adalah 
sembarang vektor dan A- adalah matriks kebalikan umum kondisional 
bagi A. Bentuk khusus dari sistem persamaan linear adalah sistem 
persamaan linear homogen, Ax = 0. Meskipun dapat jadi banyaknya 
solusi tak hingga, namun pada kasus sistem yang homogen dapat dicari 
segugus solusi yang saling ortonormal (akan didefinisikan kemudian), sebut 
saja dikumpulkan pada matriks X. Kolom-kolom matriks ini adalah solusi 
yang ortonormal, dan ordo matriks ini ditentukan oleh pangkat matriks A. 


2.5.12. Norma (Panjang) Vektor Euclidean 

Untuk sebuah vektor a berukuran n x /, norma (atau panjang) dari a 
didefinisikan sebagai Va^a . Jelas bahwa vektor b yang didefinisikan 
sebagai b = a/Va^a memiliki norma 1. Pada kasus ini b dikenal sebagai 
vektor a yang dinormalkan. Bentuk Va f a tidak lain adalah sama 

n 

dengan , dengan a,- (/ = /, ..., n) adalah unsur ke-/ dari vektor a. 

i =1 


Sebagai contoh, vektor 


a = 


2 

1 

2 


memiliki norma sebesar 


4~2 


2 + 1 2 + 2 2 


; 3, dan vektor 


23 




memiliki norma 1, karena b adalah vektor a yang dinormalkan. 

2.5.13. Jarak Euclid antar Dua Vektor 

Dengan menggambarkan vektor a dan b berukuran n x 1 sebagai titik 
pada ruang berdimensi-n, kita dapat mendefinisikan jarak antara a dan b 
sebagai norma dari vektor (a - b), dengan demikian, jarak d (a, b) 
didefinisikan sebagai 


d(a, b) = 7(a-b)'(a-b) 


dengan cu dan b/ berurutan adalah unsur ke-/ dari vektor a dan b. 
Sebagai contoh dua buah vektor 



'5' 


'6' 

a = 

3 

dan b = 

1 


2 


4 


memiliki jarak Euclid sebesar 


d(a, b) = 7(5-6) 2 +(3-l) 2 +(2-4) 2 = 3 
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Jarak Euclid adalah jarak antar titik seperti yang kita lihat menggunakan 
mata. Namun demikian, kadangkala beberapa jarak dapat didefinisikan 
dengan memberikan bobot melalui sebuah matriks definit positif (akan 
dibahas berikutnya). Jarak yang dibangun dengan memberikan bobot 
menggunakan matriks pembobot A didefinisikan sebagai berikut: 

cU(a, b) = A /(a-b)'A(a-b) 

Jelas bahwa di(a, b) = d(a, b). Salah satu jarak terboboti yang umum 
digunakan dalam analisis peubah ganda adalah jarak Mahalanobis. 

Secara umum, fungsi dari jarak misalnya d(a, b) dapat didefinisikan 
dengan banyak cara. Namun fungsi jarak itu haruslah memenuhi 
persyaratan berikut: 

c. d (a, b) = 0, jika dan hanya jika a = b 

d. d (a, b) = d (b, a) 

e. d (a, b) > 0 

f. d (a, c) < d (a, b) + d (b, c) 

Dapat diperiksa bahwa d(a, b) dan dA(a, b) memenuhi syarat di atas. 
Perlu menjadi catatan bahwa dalam statistika seringkali jarak kuadrat 
juga disebutkan sebagai jarak. Ini seringkali terjadi pada kasus analisis 
gerombol. Dalam konteks ini, seringkali juga kita menggunakan jarak 
sebagai ukuran ketakmiripan ( dissimilorify ) antar objek atau individu. 
Walaupun, sebenarnya banyak juga indeks ketakmiripan lain yang 
digunakan, dan indeks ketakmiripan ini tidak selalu memenuhi syarat 
sebagai jarak. 
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2.5.14. Vektor dan Matriks Ortogonal 

Dua buah vektor berukuran n x 7, a dan b dikatakan ortogonal satu sama 
lain jika a’b = 0. Lebih jauh, jika a dan b adalah vektor yang dinormalkan 
(yaitu a’a = 1 = b’b) maka keduanya disebut ortonormal. Sebagai contoh. 



y 


"-f 

a = 

i 

dan b = 

0 


i 


i 


adalah dua matriks yang saling ortogonal. Jika untuk yang dinormalkan, 
yaitu a/V3 dan b/V2 maka keduanya bersifat saling ortonormal. 

Sebuah matriks A berukuran n x n dikatakan sebagai matriks ortogonal jika 

A’A = AA’ = l n 

Hal ini secara cukup setara dengan mengatakan bahwa semua baris 
(atau kolom) matriks A bersifat ortonormal satu dengan yang lain. Karena 
pada matriks ortogonal berlaku A’A = AA’ = l n , maka A’ juga berfungsi 
sebagai kebalikan matriks A. Dengan demikian, A juga bersifat non- 
singular, dan jelas bahwa A’ juga bersifat ortogonal. 

Misalkan m < n dan A berukuran n x m, sedemikian rupa sehingga semua 
kolom matriks A bersifat ortonormal. Dalam hal ini 

A’A = lm 

tetapi tidak berlaku untuk AA’. Jika ini yang terjadi, maka A disebut 
sebagai matriks sub-ortogonal. 

Matriks A berikut ini adalah contoh matriks orthogonal, 
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1 

1 

1 

s 

77 

~V6 

1 

1 

1 

77 

“72 

a/6 

1 

0 

2 

77 

Te . 


Tetapi matriks Ai berikut: 


1 

1 

72 

“76 

1 

1 

“71 

“77 

0 

2 

S . 


adalah matriks sub-ortogonal karena hanya Ai’Ai = I 2 , tetapi A 1 A 1 ’ tidak 
sama dengan b. 

Melakukan penggandaan di depan sebuah matriks dengan 
menggunakan matriks ortogonal, menghasilkan rotasi sumbu. Hal ini 
seringkali nanti kita jumpai pada konteks analisis komponen utama dan 
analisis faktor. 


2.5.15. Akar Ciri dan Vektor Ciri 

Misalkan A adalah matriks berukuran n x n. Pasangan-pasangan pu, xi), 
..., (A, n , x n ) dikatakan sebagai pasangan akar ciri dan vektor ciri jika semua 
pu, Xi) memenuhi persamaan 


A x = / x 

Jika Xi memenuhi hal di atas, maka kelipatan dari Xi juga memenuhi. Jadi 
itulah sebabnya sering kita bekerja dengan vektor ciri Xi yang normanya 1. 
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Pada kasus tertentu, nilai akar ciri dan unsur vektor ciri dapat berupa 
bilangan kompleks. Jika ada akar ciri yang bernilai nol, maka ini juga 
berarti bahwa matriks A bersifat singular. 

Jika A non-singular maka A' 1 ada, dan akar ciri dari A' 1 adalah 

1 1 



dengan vektor ciri yang berpadanan sama dengan vektor ciri matriks A. 

Jika A adalah matriks segitiga atas atau segitiga bawah maka akar ciri 
dari matriks A tidak lain adalah sama dengan unsur-unsur diagonal matriks 
tersebut. 

Nilai akar ciri mungkin berulang. Jika akar ciri berulang r kali, maka 
dikatakan bahwa akar ciri tersebut berulang r. Jika A bersifat simetrik, 
maka vektor ciri yang berpadanan dengan akar ciri yang berbeda 
bersifat ortonormal (setelah dinormalkan). Lebih jauh, vektor ciri yang 
berpadanan dengan akar ciri yang berulang r tidak harus ortonormal, tapi 
kita dapat mendapatkan r vektor ciri berbeda yang bersifat ortonormal. 
Menggabungkan hal tersebut, kita selalu dapat mendapatkan n buah 
vektor ciri yang ortonormal dari sebuah matriks simetrik. 

Jadi, jika sudah diperoleh vektor ciri yang ortonormal, misalkan xi, ..., x n , 
kita memiliki n buah persamaan 


Axi = A,ixi 


AXn — XnXn 
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Menuliskan persamaan tersebut secara berdampingan menghasilkan 
persamaan matriks 


(Axi I AX 2 I ... I Ax n ) = (A,lXl I ^ 2 X 2 | ... | XnX n ) 


atau 


A (Xl I X2 I ... I Xn) = (xi I X2 | ... | Xn) 


K 

0 


0 


0 

0 


0 0 


2 


Misalkan A = diagpu, ...,A, n ) dan P = (xi | X 2 | ... | x n ). Jelas bahwa A 
adalah matriks diagonal dan P adalah matriks ortogonal, karena semua Xi 
bersifat ortonormal. Dengan demikian diperoleh 


AP = PA 


atau 


A = PAP’ 

Kenyataan di atas merupakan penguraian matriks yang penting pada 
matriks simetrik, seperti yang akan dibahas berikutnya. 


2.5.16. Penguraian Spektral dari Sebuah Matriks Simetrik 

Misalkan A adalah matriks simetrik berukuran n x n. Maka A dapat 
dituliskan sebagai 


A = PAP’ 
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dengan P adalah suatu matriks ortogonal dan A adalah matriks diagonal. 
Tentu saja pemilihan P dan A seperti yang telah dibahas sebelumnya. 
Penguraian seperti ini disebut sebagai penguraian spektral matirks A. 
Karena ketidakunikan vektor ciri, maka penguraian ini pun tidak unik. 

2.5.17. Akar Ciri dan Vektor Ciri Umum 

Misalkan A dan B adalah dua matriks simetrik berukuran n x n, dan B 
bersifat definit positif. Maka (81, xi), ..., (Sn, x n ) adalah pasangan akar ciri 
dan vektor ciri matriks A engan memperhitungkan matriks B jika memenuhi 
persamaan ciri umum 


A X- = S t B X t 

untuk semua i = 1, ..., n. Dengan mendefinisikan Q = (xi | X 2 | ... | x n ), 
kesemua n persamaan di atas dapat dituliskan dalam persamaan matriks 
menjadi 


AQ = BQA 

dimana A = diag(8i, ..., Sn). Masalah akar ciri umum ini kadangkala 
muncul pada banyak analisis statistik. Salah satunya adalah pada 
penyusunan fungsi diskriminan kanonik. 

2.5.18. Determinan Matriks 

Pada tulisan ini, didefinisikan determinan dari matriks A berukuran nxn 
adalah perkalian dari semua akar ciri A, A,i, ..., Xn , dan dinotasikan | A |, 
sehingga 

| A | = h x ... XXn 
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Jadi | A | = 0 jika dan hanya jika paling tidak ada satu akar ciri yang 0, 
yaitu terjadi jika dan hanya jika A singular. 

Jika A dan B adalah dua matriks persegi berukuran n, maka | AB | = 

| A | x | B | = | B | x | A | = | BA |. Dengan demikian jelas bahwa jika A non 
singular maka | A 1 | = | A | 1 , karena |l| = 1. Dapat pula ditunjukkan 
bahwa jika A matriks ortogonal maka |AA’| = |l| =1 = |A| |A’| = 
| A| | A | = | A | 2 , sehingga |A|=1 atau |A| = -1. 

2.5.19. Teras Matriks 

Teras dari matriks A berukuran n x n didefinisikan sebagai penjumlahan 
semua akar cirinya, dan dinotasikan tr( A), sehingga 

tr( A) = Xi + ... + Xn 

Bisa ditunjukkan bahwa fr(A) = an + 022 + ... + Onn , jumlah dari unsur-unsur 
diagonalnya. Padanan ini merupakan konsep yang sangat berguna 
pada pengembangan teori komponen utama. 

Sebagai contoh, jika 


"3 

4 

f 


'2 

1 

f 

2 

3 

0 

dan B = 

0 

1 

2 

1 

2 

1 


1 

0 

2 


maka tr( A) = 3 + 3 + 1 = 7 dan fr/(B) = 2 + 1 + 2 = 5 

Jika A dan B adalah dua buah matriks yang berturut-turut berukuran mxn 
dan nxm maka fr(AB) = fr(BA). Pada ilustrasi sebelumnya. 
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'7 

7 

13' 


'9 

13 

3' 

AB = 

4 

5 

8 

dan BA = 

4 

7 

2 


3 

3 

7 


5 

8 

3 


serta tr( AB) = 7 + 5 + 7=19 = 9 + 7 + 3 = fr(BA) 


2.5.20. Pengutamaan 

Misalkan vektor a dan b didefinisikan seperti berikut, 





V 

a = 


dan b = 



_ a «_ 


K_ 


adalah dua vektor berukuran n x / dengan 01 >02 > ... >o n dan bi >b2 > 
... >bn. Maka a dikatakan diutamakan oleh b jika 

a/ <bi 

o 1 + 02 <bi + b2 


Ol + 02 + ... + On-l <bl + b2 + ... + bn 


Ol + 02+ ... + On = bl + b2 + ... + bn 

Konsep ini digunakan pada matriks simetrik yang terurai dan matriks 
diagonal yang didapatkan dengan mengurutkan dari kecil ke besar, 
seperti pada analisis komponen utama. 

2.5.21. Bentuk Kuadratik 

Misalkan A = (a,y) adalah matriks berukuran n x n dan x adalah vektor 
peubah berukuran n x / . Maka 
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x ' Ax= ZI ] a H X i x j 
i =1 j =1 

= OllXl 2 + ... + QnnXn 2 + (Ol2 + 021) XlX2 + ... + (Cln-l,n + On,n-l) Xn-lX n 

Bentuk itu adalah polinomial derajat dua dari xj, ..., x n , sehingga disebut 
sebagai bentuk kuadratik dari x. 

Misalkan, 

'1 2 3l p,' 

A = 4 2 1 dan x = x 2 

1 1 lj [jt 3 

Maka 

x’Ax = xf + 2xl + x 3 + 6x x x 2 + 4 ^X 3 + 2x 2 x 3 

Jelas bahwa x’Ax = x’A’x, dan dengan merata-ratakan juga sama 

fA + A'^l fA + A'^l 

dengan x’ - x. Karena - selalu simetrik, maka tanpa 

V 2 J V 2 ) 

mengurangi maknanya bentuk kuadratik yang didefinisikan di atas 
ditambahkan bahwa A merupakan matriks simetrik. Untuk contoh 
sebelumnya, bentuk x’Ax dengan 

“1 2 3" 

A = 4 2 1 

1 1 1 

dapat dituliskan x’Ax =x’Bx dengan 


33 



A + A 


B = 


v 2 


'3 


J 


1 3 2 
3 2 1 

2 1 1 


Pada kasus A merupakan matriks simetrik, maka bentuk kuadratik dapat 
ditampilkan menggunakan salah satu dari pernyataan berikut 

n n 

x ' Ax= YL a v x i x i 

i =1 7=1 

n n n 

= Z a » x ?+Z Tj a ‘j x , x j 

i =1 *=1 7=1(^7) 

n n n 

= Z^-v; + 2 X Ya a ', x ' x j 

i= 1 i=l 7=l(/<y) 


Persamaan 


x’Ax = c, 

dengan c sebuah konstanta, menggambarkan permukaan kuadratik 
pada ruang berdimensi-n. Jadi dapat berupa parabola, hiperbola, atau 
elipsoida, tergantung pada unsur-unsur A. Bentuk elipsoida merupakan 
bentuk khusus yang sering dijumpai di statistika, dan ini terjadi ketika B 
adalah matriks definit positif atau semidefinit positif. 

2.5.22. Matriks Definit dan Semidefinit Positif 

Sebuah matriks simetrik berukuran n x n, A dikatakan bersifat definit positif 
jika untuk sembarang vektor x * 0, bentuk kuadratik x’Ax > 0. Hampir mirip 
dengan itu, dikatakan semidefinit positif jika x’Ax > 0. Jika A adalah definit 
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positif maka persamaan x’Ax = c, dengan c adalah konstanta, akan 
berupa elipsoida. Jika A adalah matriks diagonal yang semua unsur 
diagonalnya bernilai positif, maka A adalah matriks definit positif, tapi jika 
ada paling tidak sebuah unsur bernilai 0 (yang lain positif) menjadi matriks 
semi definit positif. Matriks diagonal yang unsurnya adalah ragam 
peubah, akan bersifat demikian karena ragam tidak pernah bernilai 
negatif. 

Sudah diketahui bahwa untuk matriks yang definit positif, akar-akar cirinya 
semua bernilai positif. Demikian pula sebaliknya. Karena itulah maka 
determinan dari matriks definit positif juga bernilai positif, karena berupa 
hasil perkaliannya. Jadi determinannya tidak sama dengan nol, sehingga 
A bersifat non-singular. 

Untuk matriks B berukuran m x n, maka BB’ dan B’B bersifat semidefinit 
positif. Jika m < n dan r(B) = m maka BB’ definit positif, tapi B’B masih 
semidefinit positif. 

2.5.23. Akar Kuadrat dari Matriks Simetrik Semi Definit 
Positif 

Untuk sebuah matriks simetrik semidefinit positif A, dapat diperoleh matriks 
segitiga atas U sehingga 


A = U’U 

Persamaan di atas disebut penguraian Cholesky. Matriks U merupakan 
matriks segitiga atas, sehingga tidak simetrik. 

Akar kuadrat dari matriks simetrik, A 1/2 dapat diperoleh melalui penguraian 
spektral 


A = PAP’ = (PAi/2p’ ) (PA 1 /2 P’) = A 1/2 A 1/2 , 


35 



dengan P adalah matriks ortogonanl dan A matriks diagonal. Matriks 
diagonal A berisi akar ciri matriks A pada unsur diagonalnya, dan karena 
akar cirinya semuanya positif maka A 1/2 adalah matriks diagonal yang 
unsur diagonalnya akar kuadarat dari akar ciri. A 1/2 diperoleh dari (PA 1 / 2 P’ 
) sehingga A 1/2 bersifat simetrik. 


2.5.24. Penguraian Nilai Singular (Singular Value 
Decomposition) 

Sembarang matriks B berukuran m x n dapat dituliskan menjadi B = UQV’, 
dengan U dan V bersifat ortogonal atau sub ortogonal. Jika m lebih besar 
daripada n, maka U sub-ortogonal, dan V ortogonal. Matriks Q adalah 
matriks diagonal berukuran n x n. Jika m lebih kecil daripada n, maka 
setelah membuang (n-m) kolom nol pada U menjadi U* dan V yang 
keduanya ortogonal. Jika B merupakan matriks persegi, maka baik U dan 
V ortogonal. Unsur diagonal matriks Q adalah nilai singular matriks B. 


Penguraian nilai singular ini juga dapat dituliskan dalam bentuk kedua 
matriks di sebelah kanan dan kiri tidak hanya sub-ortogonal tapi sudah 
ortogonal. Pada kasus ini, matriks Q berukuran m x n. Jika m = n, tidak 
ada yang perlu dilakukan karena U dan V sudah ortogonal. Jika m > n, 
kita tuliskan B sebagai 


b- fr i u 

B - | mxn 


Q 

O 


( m—n ) xn 


V' 


= U*Q*V*' 
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Dalam hal ini V* = V, Q* = 


dan U* = [U | U c ]. Matriks U c dipilih 


Qmxn 


sehingga U C U = 0. Matriks U c ini disebut sebagai matriks komplemen 
ortogonal dari matriks U. 

Jika m < n, maka matriks U yang berukuran m x n memiliki (n-m) vektor nol. 
Matriks U* diperoleh dengan membuang kolom-kolom tersebut. V* sama 
dengan V, dan Q* sama dengan Q. 


2.5.25. Penguraian Nilai Singular Umum (Generalized 
Singular Value Decomposition ) 

Pada penguraian nilai singular matriks B di atas, matriks U* dan V* 
ortogonal, sehingga 


u:u* =u*u; = \ m 

dan 

vjv* = v» v’ = i n 

Jika membuang tanda *, kita ganti dengan 

UCU = I m 


dan 


V’DV = In 

dimana C dan D berturut-turut adalah matriks simetrik definit positif 
berukuran m x m dan n x n. Kita masih memiliki penguraian 

B = UQV’, 


37 



dengan U dan V memenuhi dua persyaratan tambahan. Penguraian ini 
dikenal sebagai penguraian nilai singular umum dari matriks B. 
Penguraian seperti ini akan berguna pada analisis korespondensi. 

2.5.26. Perkalian Kronecker 

Hasil perkalian Kronecker C dengan D (dinotasikan C ® D) diperoleh 
dengan mengalikan setiap unsur matriks C dengan matriks D, dan 
kemudian membuat matriks gabungannya. Dalam notasi, perkalian 
Kronecker didefinisikan C ® D = (a,D). 

Misalkan 


'1 

0 

3 

4' 


v 

0 

4 

1 

-1 

dan D = 

3 

1 

1 

-3 

2 


7 


maka hasil perkalian Kronecker C ® D adalah 


C® D = 


1 

3 

7 

0 

0 

0 

1 

3 

7 


0 3 

0 9 

0 21 
4 1 

12 3 

28 7 

1 -3 

3 -9 

7 -21 


4 

12 

28 

-1 

-3 

-7 

2 

6 

14 
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2.6. Latihan 


1. Terdapat tiga buah vector x,yz yang didefinisikan sebagai berikut: 

x’= [b -1,2] 

y’ = [2, 0,-1] 
z’ = [0, -2, 5] 

a. Apakah vektor-vektor tersebut di atas bebas linier, buktikan 
jawaban anda! 

b. Bila tidak bebas linier, buatlah vektor tertentu yang merupakan 
kombinasi linier dari vektor yang lain. 

2. Dua buah vektor, katakanlah 

x’= [-1,5, 2,-2] 

y’ = [4, -3, 0, 1] 

Berapa sudut yang dibentuk oleh dua vektor tersebut? 

3. Suatu bentuk kuadrat 

2 Xi 2 + 2X22 + 2X32+2X1X2+2X1X3+2X2X3 

a. Tentukan matriks bentuk kuadrat di atas 

b. Tentukan akar ciri dari matriks nomor a tersebut 

c. Apakah matriks tersebut matriks definit positip 

4. Suhu suatu tempat (katakan disimbolkan sebagai Y) ditentukan oleh 
dua variabel utama, katakan Xi dan X2. Tiga data tentang ketinggian 
dan nilai Xi dan X2 adalah sebagai berikut: 
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Xi 

X 2 

Y 

4 

12 

44 

5 

14 

52 

7 

16 

62 


Seorang mahasiswa ingin membuat suatu fungsi yang 
menghubungkan antara Y dengan Xi dan X 2 , katakan persamaan 
tersebut adalah 

Y = a Xi + bX 2 

Tentukan nilai a dan b persamaan diatas dengan menggunakan 
sistem Persamaan Linier. 
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3 


3.$ebaran Normal Ganda (Multivariate Normal 
Distribution ) 

3.1. Peubah Acak 

Dari suatu percobaan seringkali kita lebih tertarik pada suatu fungsi hasil 
percobaannya, bukan pada hasil percobaannya itu sendiri. Misalnya 
dalam pelemparan dua dadu kita sering tertarik pada jumlah mata dadu 
yang muncul dari kedua dadu, bukan hasil dari masing-masing dadu 
tersebut. Dengan kata lain, kita mungkin tertarik ingin tahu apakah 
jumlahnya 5 dan tidak peduli apakah hasil percobaan yang 
sesungguhnya dadu yang muncul (1,4) atau (2,3) atau (3,2) atau (4,1). 
Besaran-besaran yang menjadi perhatian kita ini, atau lebih formalnya , 
fungsi bernilai real yang didefinisikan pada ruang contoh percobaan ini, 
di kenal sebagai peubah acak (random variabel). Atau dengan kata lain 
peubah acak adalah suatu fungsi yang memetakan unsur-unsur ruang 
contoh suatu percobaan terhadap suatu gugus bilangan-bilangan nyata 
sebagai wilayah fungsi. 


3.2. Fungsi Sebaran 

Yang di maksud dengan fungsi sebaran atau fungsi sebaran kumulatif 
suatu peubah acak X ialah: 


F (x) = P (X < x ) 
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untuk semua bilangan nyata x, - ao < x < ao . Dengan kata lain, F(x) 
menyatakan peluang bahwa peubah acak X mengambil nilai lebih kecil 
atau sama dengan x. Beberapa sifat fungsi sebaran kumulatif adalah : 

1. F adalah suatu fungsi tidak turun (nondecreasing function); artinya 
jika a < x , maka F (a) < F (x). 

2 . LimF(x) = 1 

X—»00 

LimF(x ) = 0 

3. 

4. F (x) kontinu kanan, artinya Lim F(x) = F(x 0 ) 

x^x 0 + 

3.3. Peubah Acak Diskret 

Peubah acak diskret adalah peubah acak yang himpunan semua 
kemungkinan nilai yang dapat diambilnya terhingga atau tak hingga 
tercacah. Bagi suatu peubah acak diskret X, kita definisikan fungsi massa 
peluang P (a) sebagai: 


P (a) = P (X = a ) 

Fungsi massa peluang P (a) bernilai positif untuk paling banyak sejumlah 
tercacah nilai a. Dengan kata lain, jika X mengambil salah satu dari nilai- 
nilai xl, x2, ... maka: 


P (xi) > Oi = 1,2,... 

P (x) = 0 semua nilai x lainnya 
Karena X pasti mengambil salah satu dari nilai xi, maka : 

Ep(*«) = 1 


Contoh-contoh peubah acak diskret antara lain peubah acak Bernoulli, 
peubah acak binom, peubah acak Poisson dan lain-lain. 
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3.4. Peubah Acak Kontinu 


Peubah acak kontinu adalah peubah acak yang himpunan semua 
kemungkinan nilai yang dapat diambilnya tak tercacah. Misalkan X 
adalah peubah acak kita katakan bahwa X adalah suatu peubah acak 
kontinu jika ada suatu fungsi tak negatif f, yang terdefinisikan untuk semua 
bilangan nyata x e (-00,00), dengan sifat bahwa untuk sembarang 
himpunan bilangan nyata R, 

P{X gR)= \f(x)dx 

R 

Fungsi f ini dinamakan fungsi kepekatan peluang bagi peubah acak X. 
Dengan kata lain persamaan di atas mengatakan bahwa peluang X ada 
di dalam R dapat diperoleh dengan cara mengintegralkan fungsi 
kepekatan peluangnya pada himpunan R. 

Karena x pasti mengambil suatu nilai, maka f pasti memenuhi: 

P{X e B} = J/(x)dx = 1 

Contoh-contoh peubah acak kontinu antara lain peubah acak normal, 
seragam, weibull, gamma, dan lain-lain. 

3.5. Peubah Acak Ganda 

Peubah acak adalah suatu fungsi yang memetakan unsur-unsur ruang 
contoh suatu percobaan terhadap suatu gugus bilangan-bilangan nyata 
sebagai wilayah fungsi. Misalkan peubah acak tersebut dilambangkan 
sebagai X, dengan U={ui, U2, ..., u n } sebagai daerahnya, maka yang 
dimaksudnya sebagai X(ui) ialah suatu unsur yang merupakan bayangan 
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unsur Ui e U, semua unsur X(ui) ini terkandung di dalam wilayah peubah 
acak X, yaitu W x e R. Misalkan 3 keping mata uang dilempar dengan 
serentak, maka sebagai hasilnya akan termasuk dalam ruang contoh U, 

U = {(+.+.+). . (+.-.+). (-.+.+). } 

Apabila sisi - yang diperhatikan, maka unsur (+,+,+) di dalam u diberi nilai 
0 , karena tidak satu pun sisi - yang muncul. Sehingga dapat kita buat 
pemetaan sebagai berikut: 



U adalah daerah pemetaan dan R adalah wilayahnya. Gugus R juga 
dapat dipandang sebagai ruang contoh percobaan kalau hasil suatu 
percobaan tidak dibatasi sebagai perincian letak ketiga macam uang 
yang dilempar, tetapi sebagai jumlah sisi yang - yang muncul. Dengan 
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memberi nilai seperti ini, ruang contoh baru R ini terdiri dari bilangan 
cacah yang merupakan bagian dari bilangan nyata R. Pemetaan dari U 
ke R merupakan suatu contoh mengenai peubah acak. 

Namun seringkali hasil suatu percobaan tidak cukup dinyatakan dengan 
hanya satu macam sifat. Dengan mengetahui beberapa ciri suatu benda 
atau hasil dari suatu percobaan, kita berharap dapat mengetahui lebih 
banyak sifat benda atau hasil percobaan tersebut. Dalam hal ini kita 
menghadapi sifat ganda suatu benda yang seringkali berkaitan satu 
sama lain. Peubah acak tersebut adalah peubah acak ganda-p (peubah 
ganda-p, vektor peubah acak berdimensi p). 


3.6. Pengertian Peubah Acak Ganda 

Misalkan Xi, X 2 , ... , X p merupakan p buah peubah acak yang didefinisikan 
pada ruang ukuran peluang (U, (3, p) yang sama. Setiap peubah acak Xi , 
i=l ,2, ... p memetakan U ke R. 

Vektor X’ = (Xi,X 2 , ... , X p ) yang memetakan u ke R p dimana X’ (u) = 
(Xi(u),... , X p (u)) , u e U disebut peubah acak ganda-p, jika bayangan 
kebalikan setiap selang berdimensi-p : 


l = {(Xi,X 2 .Xp) ; - ao < Xi < n, n e R , i = 1,2,... p } 


merupakan kejadian pada (3, yaitu jika : 

X 1 (u)= { u ; Xi (u) < n ,..., X p (u) < r p } e (3 untuk setiap n e R. 
Misalkan peubah acak X berdimensi p didefinisikan sebagai vektor: 

X’ = [Xi,X 2 .Xp] 
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Notasi ragam untuk vektor acak p komponen adalah matriks ragam 
peragam : 


Cov(X, X ) =E{[X-E(X)][X-E(x )]'} 


’ll • 

•• a \p 

'l p • 

•• Vpp 


Kita sering menamai matriks simetrik tersebut dengan matriks kovarian dari 
X. Sedangkan ragam untuk kombinasi linear a’X = aiXi + ... + a P X p dari 
peubah acak adalah ; 


Var(a X) = X S a t aj a tj 
i= 1 7=1 

= a Ha 

Kovarian dari dua kombinasi linear a’X dan b’X adalah : 

Cov(a X,b X) = S S 

i=lj=l 

= a Hb 

Secara umum, jika A dan B mempunyai dimensi r x p dan s x p maka 
kovarian dari transformasi: Y = AX dan Z = BX adalah matriks dimana : 
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Cov{Y,Y) =ATA 

Cov(Z,Z ) = BXB 

Cov(Y,Z ) = ALB 

R = matriks korelasi dari populasi: 

1 p n ■■■ P\ p 

_ Pn 1 ••• Pip 

K — 

Plp Plp ••• 1 

dimana D[g\) adalah matriks diagonal yang unsur-unsurnya merupakan 
simpangan baku dari peubah acak ke-i, maka matriks kovarian dan 
korelasi mempunyai hubungan sebagai berikut: 

^ > <r, > / > <f, : 

3.7. Sebaran Normal Ganda Dan Sifat-Sifatnya 

Fungsi kepekatan normal ganda (multivariate normal) adalah generalisasi 
dari fungsi kepekatan univariate normal dengan p > 2 dimensi. Fungsi 
kepekatan dari peubah acak x yang menyebar normal dengan nilai 
tengah ja dan ragam a 2 adalah: 

/(*)= , 1 = e-\(x-p)/cr] 2 /2 

V2n cr 2 

dimana -oo<x< oo. 


Al 



Plot dari fungsi ini akan menghasilkan kurva berbentuk genta (Gambar 
3.1) yang memiliki ciri-ciri sebagai berikut: 

1. Simetrik terhadap nilai tengah (ji) 

2. Mean, median, modus berada pada titik yang sama 

3. P((^-0<x<ji + a) = 0.683 

4. P [\x - 20 < x < |i + 2a ) = 0.954 


Fungsi kepekatan normal dengan nilai tengah ji dan ragam a 2 dinotasikan 
sebagai N (ji,a 2 ), notasi ini akan digunakan pada kasus multivariate yang 
akan dibahas selanjutnya. 



X 


Gambar 3.1 Sebaran normal dengan nilai tengah ju dan ragam cj 


Fungsi kepekatan bersama dari peubah acak yang menyebar normal 
dan saling bebas adalah: 


f(x l ,...,x ) = 


(2n) 


p/2 




- E xp 


-l/2± 

f W 

%i -p, 

i =1 

{ <?i )_ 


“|2 


bentuk [ (xi - |i)/a] 2 dari eksponen fungsi sebaran normal mengukur jarak 
kuadrat dari Xi ke ji dalam unit simpangan baku. Bentuk ini dapat 


48 














digeneralisasikan untuk pxl vektor x dari pengamatan beberapa peubah 
sebagai: 


(x - jx) ’ Ir' (x - |x) 


dimana: 


x’ = [xl, ..., xp] vektor peubah 

[i’ = f|ii,..., |i P J nilai tengah dari vektor acak x 

E = matriks ragam peragam ( covariance ) 


E = 


0..j cr 


maka fungsi kepekatan peluang bersamanya dapat ditulis sebagai 
berikut: 


f(x) = --- -rr £'xp|-l/2(x-//)'S" 1 (x-//) 

(27r) p/2 \l\ /2 

dimana -oo < xi < ao , i = 1,2,...p. Fungsi kepekatan normal berdimensi p ini 
dapat ditulis sebagai N p (n,Z) yang analog dengan kasus univariate. 

Sebagai ilustrasi disajikan gambar fungsi kepekatan normal ganda 2 
dengan pusat di |ai=|i2=0, Gi2=a22=l dan ai2=0. 


49 



f(x1 ,x2) 



Gambar 3.2 Sebaran normal ganda 2 dengan Hi = l^ 2 = 0, <7 12 =<j 22 =1 dan cr 12 =0 


3.8. Kontur 

Eksponen (x - pi)’ S-l (x - ji) dari kepekatan normal ganda memperlihatkan 
persamaan elipsoid dalam ruang peubah berdimensi p jika berbantuk ini, 
ditulis dalam sebuah persamaan terhadap sebuah nilai konstanta positif c. 
Keluarga elipsoid ini dibangkitkan dari konstanta c yang bervariasi 
dengan nilai tengah ji. 

Kontur dari fungsi peluang kepekatan untuk nilai konstanta 
c = {semua x yang memenuhi (x-ja)’S-l (x - ja) = c2} 

= permukaan ellips berpusat pada ji 

absis bagi setiap ellip dari kepekatan yang konstan adalah arah vektor 
ciri dari Z-l dan panjangnya porporsional terhadap akar kuadrat dari nilai 
akar ciri Z-l . 
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Teorema: 


Jika Z definisi positif maka Z-l ada, Z e = 'k e berimplikasi Z-l e = (1 /X)e, 
sehinggga (Z.e) adalah pasangan nilai akar ciri dan vektor ciri bagi Z 
koresponden terhadap pasangan (1/Z,e) untuk Z-l .Z-l juga positif. 

Kontur dari kepekatan yang konstan dari sebaran normal berdimensi p 
adalah ellipsoid, sedemikian sehingga: 

(x - pi)’ Z-l (x - ji) = c2 

dengan pusat ellips adalah dan absis tcVziei , dimana 

Z ei = X\ ei , i = 1,2,...p. 

Sifat-sifat sebaran normal ganda : 

♦ Kombinasi linier dari semua komponen peubah x juga menyebar 
normal. Jika X p ~ N p ( jj, , Z ) , maka kombinasi linear dari peubah a’X = 
ai Xi + 02 X 2 +...+ a P X p menyebar N ( a’ n , a’ Z a ) 

♦ Jika X p - N p ( ^ , Z ) maka semua anak gugus dari X juga menyebar 
normal. Semua anak gugus X menyebar normal. Jika X dipartisi, vektor 
nilai tengah ji, dan kovarian matriks Z , sebagai berikut: 


(ax 1) 

M = 

M\ 

(?xl) 

Z- 

(pxp) 

' 2 11 

(qxq) 

S 12 

( qx(p-q)) 

x 2 

Mi 

S 2I 

^22 

_((p-a)x l ) _ 


_((p-q)x l ) _ 


_{{p-q)xq) {{p-q)x{p-q))_ 


dan 

^21 ^22 _y 


N 


ql+q2 


VL 


El 

Mi 
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maka XI ~ Nq (jabali). 


♦ Kovarian bernilai nol mengimplikasikan komponen yang berpadanan 
saling bebas. 

Jika Xi dan X2 saling bebas, maka kovarian (Xi, X2) = 0 

Jika Xi dan X2 saling bebas, dan menyebar N q i (jai, Sn) dan N q 2 
(pi2, S22) maka sebaran bersyarat [xi 1x2] adalah normal ganda : 



♦ Sebaran bersyarat dari semua peubah menyebar normal ganda: 

x Z E 

X = — ~ N p ( ju , S) dengan ju = —- , E ——— dan | S22 1 

E21 E 22 

> 0 . Maka sebaran bersyarat X dengan X2 = X2 adalah normal dengan 
nilai tengah = jai + £12 £22 _1 (X2 -112) dan kovarian Sn -S12 S22 -1 S21. 

♦ Dua sifat terakhir dari sebaran normal ganda. Sebaran X 2 menentukan 
keragaman dari ragam contoh S 2 = Sn untuk contoh dari sebaran 
normal. Hal ini juga penting dalam kasus normal ganda. Jika X ~ N p 
(|i,S) dengan | S | > 0 maka: 

a. (x - ji) S ' 1 (x - ja) ~ X p 2 dimana X p 2 menyatakan sebaran khi kuadrat 
dengan derajat bebas p. 

b. Selang kepercayaan (1 - a) -» (x-ji)’S - 1 (x - ji) = x[ a p) • 
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3.9. Eksplorasi Sebaran Normal Ganda 


Untuk mengevaluasi apakah gugus data yang dimiliki menyebar normal 
ganda dapat ditelusuri dengan cara ekplorasi. Seperti halnya untuk kasus 
univariate penelusuran sebaran normal ganda dapat juga 
memanfaatkan plot quantil-quantil. Plot quantil-quantil yang digunakan 
dalam kasus univariate adalah quantil normal sedangkan dalam kasus 
multivariate plot quantil-quantil didekati dengan quantil khi-kuadrat. 

Beberapa tahapan yang harus dilakukan dalam menyusun Plot Kuartil y 2 
adalah sebagai berikut: 

1. Hitung: 

d/ =(x U) -\i)^'(x (i) -|.i) 

2. Beri peringkat nilai dn 2 

3. Carilah nilai khi-kuadrat dari nilai (i —1 /2)/n dengan derajat bebas 
p. 



4. 


Buat plot Xp 



dengan dn 2 , bila pola hubungannya 


mengikuti garis lurus maka data tersebut dapat dikatakan 
menyebar normal ganda. Namun demikian untuk lebih 
menyakinkan dapat dilakukan dengan menghitung nilai korelasi 
person 



dengan dn 2 . Apabila nilai korelasi ini nyata maka data tersebut 
mengikuti sebaran normal ganda. 
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Contoh: 


Dari suatu pengamatan diperoleh data sebagai berikut: 


No. 

Xi 

X 2 

X 3 

No. 

Xi 

X 2 

x 3 

1 

98 

81 

38 

13 

138 

98 

51 

2 

103 

84 

38 

14 

138 

99 

51 

3 

103 

86 

42 

15 

141 

105 

53 

4 

105 

86 

42 

16 

147 

108 

57 

5 

109 

88 

44 

17 

149 

107 

55 

6 

123 

92 

50 

18 

153 

107 

56 

7 

123 

95 

46 

19 

155 

115 

63 

8 

133 

99 

51 

20 

155 

117 

60 

9 

133 

102 

51 

21 

158 

115 

62 

10 

133 

102 

51 

22 

159 

118 

63 

11 

134 

100 

48 

23 

162 

124 

61 

12 

136 

102 

49 

24 

177 

132 

67 


Secara eksplorasi ketiga peubah yang diamati tidak ada yang aneh, 
bahkan dari diagram kotak garis terlihat bahwa ketiga peubah menyebar 
simetrik (Gambar 3.3). 
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Boxplot masing-masing variabel X 



Gambar 3.3 Diagram kotak garis untuk peubah XI, X2 dan X3 


Sementara pada Gambar 3.4 disajikan plot kuantil ketiga peubah 
membentuk garis lurus yang mengindikasikan ketiga peubah menyebar 
normal, hal ini juga didukung oleh hasil pengujian kenormalan 
Kolmogorov-Smirnov dimana nilai p_value yang lebih besar dari 5%. Jadi 
untuk masing-masing peubah tersebut menyebar Normal. 


Uji kenormalan x1 


Uji kenormalan x2 


Uji kenormalan x3 



Gambar 3.4 Uji kenormalan Kolmogorov-Smirnov untuk peubah XI, X2 dan X3 

Plot kuantil-kuantil khi-kuadrat dari ketiga peubah menunjukkan pola yang 
linier sehingga dapat dapat disimpulkan ketiga peubah tersebut 
menyebar Normal Ganda. Perhitungan d 2 dan % 2 (p) secara lengkap 
dapat dilihat pada Tabel 3.1. 
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Plot Kuantil Khi kuadrat 



Gambar 3.5 Plot quantil khi-kuadrat untuk peubah XI, X2 dan X3 

Untuk membuktikan apakah plot tersebut benar-benar menunjukkan 
Normal Ganda maka dicari korelasi antara d 2 dengan x 2 (p) yaitu ro = 
0.962442 yang lebih besar dari batas kritis pada taraf nyata 5% yaitu 
0.9564. Ini menunjukkan bahwa d 2 dan x 2 (P) nnemiliki hubungan linier 
yang nyata. 


Tabel 3.1 Perhitungan d 2 dan x(p) 


Amatan 

xl 

x2 

x3 

d 2 

Peringkat 

d 2 

p= 

(i-1 /2)/n 

X 2 (P) 

1 

98 

81 

38 

0.149 

16 

0.646 

3.254 

2 

103 

84 

38 

0.179 

19 

0.771 

4.317 

3 

103 

86 

42 

0.179 

18 

0.729 

3.915 

4 

105 

86 

42 

0.123 

13 

0.521 

2.479 

5 

109 

88 

44 

0.114 

11 

0.438 

2.048 

6 

123 

92 

50 

0.213 

21 

0.854 

5.383 

7 

123 

95 

46 

0.040 

6 

0.229 

1.126 

8 

133 

99 

51 

0.019 

4 

0.146 

0.780 

9 

133 

102 

51 

0.009 

1.5 

0.042 

0.309 
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Amatan 

xl 

x2 

x3 

d 2 

Peringkat 

d 2 

p= 

(i-1 /2)/n 

X 2 (P) 

10 

133 

102 

51 

0.009 

1.5 

0.042 

0.309 

11 

134 

100 

48 

0.128 

15 

0.604 

2.973 

12 

136 

102 

49 

0.115 

12 

0.479 

2.257 

13 

138 

98 

51 

0.160 

17 

0.688 

3.564 

14 

138 

99 

51 

0.113 

10 

0.396 

1.850 

15 

141 

105 

53 

0.011 

3 

0.104 

0.603 

16 

147 

108 

57 

0.038 

5 

0.188 

0.954 

17 

149 

107 

55 

0.083 

8 

0.313 

1.477 

18 

153 

107 

56 

0.196 

20 

0.813 

4.794 

19 

155 

115 

63 

0.230 

22 

0.896 

6.158 

20 

155 

117 

60 

0.079 

7 

0.271 

1.300 

21 

158 

115 

62 

0.108 

9 

0.354 

1.660 

22 

159 

118 

63 

0.125 

14 

0.563 

2.716 

23 

162 

124 

61 

0.283 

23 

0.938 

7.315 

24 

177 

132 

67 

0.296 

24 

0.979 

9.748 


3.10. Pengambilan Contoh Dari Sebaran Normal 
Ganda 

3.10.1. Likelihood Normal Ganda 

Diasumsikan p x 1 vektor Xi, X 2 , X 3 , ... , X n adalah contoh acak dari 
populasi normal ganda dengan vektor rataan ja dan matrik covariance Z , 
Xi, X 2 / X 3 / ... , X n saling bebas dan masing-masing menyebar N p (ja,Z) , 
fungsi kepekatan bersama untuk seluruh observasi ini adalah perkalian 
dan kepekatan normal ganda. 
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Jadi, 


kepekatm\bersama\ J± 
dariX l ,X 2 ,...,X n J 




p/ - ,i/ 


- Z (Xj-ju)l, l (Xj-ju)/ 2 
7=1 


Ketika nilai numerik dari observasi tersedia, ini dapat disubsitusikan untuk Xj 
dalam persamaan di atas. Hasilnya, dipikirkan sebagai fungsi dari ji dan Z 
untuk deret tetap observasi Xi, X 2 , X 3 , ... , X n disebut sebagai Likelihood. 

Banyak prosedur statistik yang menggunakan nilai data observasi terbaik 
yang menerangkan parameter populasi. Terbaik artinya memilih nilai 
parameter yang dapat memaksimumkan kepekatan bersama yang 
dievalusasi darti observasi data. Teknik ini disebut pendugaan maksimum 
likelihood dan nilai parameter yang dimaksimumkan disebut penduga 
maksimum likelihood. 

Kita akan memikirkan penduga maksimum likelihood dari parameter ji 
dan Z untuk populasi normal ganda, jadi, kita ambil contoh, Xi, X 2 , X 3 , ... , 
X n yang tetap dan memikirkan kepekatan bersamanya dengan 
persamaan di atas. 

Hasilnya berupa sebuah fungsi likelihood. Kita akan memerlukan 
beberapa tambahan sifat untuk teras matriks segi. ( Teras suatu matriks 
adalah jumlah elemen diagonalnya ). 

Umpamakan A adalah k x k matriks simetrik dan x adalah vektor k x 1. 
a. x Ax = tr (x ’Ax) = tr (Axx’J 


1 1 
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k 

b. tr (A) = E A t , dimana A,i adalah nilai eigen dari A 

i =i 


Bukti 

Untuk bagian a, kita perhatikan bahwa x’Ax adalah skalar, jadi x’Ax = tr 
(x’Ax), terlihat bahwa tr (BC) = tr(CB) untuk setiap 2 matrik B dan C 

k 

dengan dimensi m x k dan k x m. Hal ini karena BC mempunyai E^/ c n 

7=1 

sebagai elemen diagonal ke-I, sehingga 

m ( k \ 

tr (BC) = E ZV* 

m=1 \7 =1 


m 

sama untuk elemen diagonal CB adalah . 

i =1 


Jadi, 


tr (CB) = i 

7=1 


X C fi b V 

7=1 


k 

I'A 
\j =i 


r ■ 
IJ^Jl 


\ 

-tr (BC). 

) 


Misal X’ adalah matrik B dengan m=l dan misal Ax memainkan aturan 
matrik C. Maka tr (x’(Ax)) = tr ((Ax )x ) = tr (Axx). 

Bagian b dibuktikan dengan dekomposisi spektral, untuk menulis A = P’AP, 

dimana PP’ = I dan a adalah matrik diagonal dengan masukan fa, fa . fa. 

Oleh sebab itu, tr (A) = tr (P’aP) = tr (aPP ) = tr (a) = A,i +fa + ... + fa . 

Sekarang kepekatan bersama eksponen dalam persamaan dapat 
disederhanakan, yaitu : 
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(Xj - //) V-‘ ( .v , -ju)=tr J i/ -/C 

= fr l _1 ^7 “/'>] 


i *,-„>-* *, - t» *, - 




M 


7=1 


f> J " 1 


>> 


7=1 


= tr 


J »>_ 


( n \ 

1 Y.{X j -ju){X j -ju) 

V J= l ) 


Karena teras dari jumlah suatu matrik adalah sama dengan jumlah teras 
matriks-matriks tersebut kita dapat menambahkan dan mengurangkan 

^ = pada tiap-tiap suku (Xj-pi) dalam X(Xj-//)(Xj- M) 

n 7=1 7=1 

sehingga : 


E(x .-x+x-fiXXj-x+x-fi) =S(Xj-xxxj-x) +S(x-//)(x-//) 

7=1 7=1 7=1 


X(Xj-X)(Xj-X) +n(X-ju)(X-ju) 

7=1 


n ~ ~ , n - , 

karena perkalian tiap suku, X(Xj-X)(X-//) dan 2(X-/0( x j-^O > 

7=1 7=1 

keduanya matriks nol. Kepekatan bersama contoh acak dari populasi 
normal ganda dapat dituliskan sebagai berikut: 
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f kepeka tan bersama] 
\dariX l ,X 2 ,...,X n J 


|s| /2 exp<! -tr\ 


H(X j -X)(X j 

7=1 


-X) +n(X-ju)(X-M) 


/2 


Substitusi nilai-nilai Xi, X2, X3, , X n pada kepekatan bersama yang 

menghasilkan fungsi likelihood. Kita akan menunjukkan fungsi ini oleh 
L(ja,Z) untuk menekankan fakta bahwa ini adalah fungsi dari (tidak 
diketahui) parameter populasi \i dan Z. Jadi, ketika vektor Xj mengandung 
bilangan yang spesifik dari observasi yang sebenarnya, kita punya : 


-tr 

L(n,Z)= ---— ^ 

inj' 2 | z |/2 

Akan baik sekali bila diakhir bagian ini untuk menuliskan bentuk eksponen 
dari fungsi likelihood dalam cara yang berbeda. Terutama, kita akan 
menggunakan identitas: 


. -i 


X j-x 


X j-x 


+n\ X-p X~ju 


/2 


f - Y - "i 

(- \ 

f - \ 

Xj-x\Xj-x\ + n\ 

X~ju 

X~ju 

v A ) 

V / 

V ) 


= tr 



f 

£(Xj-X)(Xj-X )’ +n(X- J Li)(X- J Li)' 
\j =1 




J 


= tr 



i(Xj-X)(Xj-X) 

\j =l 


+ n(X-/j)I. \X-/u) 


J 


3.10.2. Pendugaan Maksimum Likelihood untuk jLt dan E 

Misal B adalah matriks simetri definit positif berukuran p x p dan skalar b > 
0. 
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J_ e -tr(X- l B)l2 < J_ ( 2 b) pb e ~ bp 

H* \B\ h 


untuk seluruh Z yang definit positif, dengan persamaan yang ada 

pxp 

hanya untuk 

1= (1/2 b) B 

Bukti 

Anggap B 1 / 2 adalah akan kuadrat dari B jadi B 1 / 2 B 1/2 = B, B 1 / 2 = I dan B- 1 / 2 B- 
] /2 = B- 1 , maka tr (Z -1 B) = tr [(Z -1 B 1 / 2 ) B 1 / 2 ] = tr [B 1/2 (Z -1 B 1 / 2 )]. Anggap n 
adalah nilai eigen dan B 1/2 Z -1 B 1/2 . Matriks ini positif definit karena y’ B 1/2 Z -1 
B 1/2 y = (B 1/2 v)’ Z 1 (B 1/2 y) > 0 jika B 1/2 y * 0 atau sama juga, y * 0. Jadi nilai 
eigen rji dan B 1/2 Z _1 B 1/2 adalah positif. Memberikan hasil : tr (Z' 1 B) = tr (B 1 /2 Z~ 

1 B 1/2 )= Z/ 7 ; dan | B 1/2 Z _1 B 1/2 1 = {[jj. 

i =1 i =1 

Kita dapat menuliskan : | 1 = |B'/ 2 | | S 1 | |B'/ 2 | = |S'| |B'/ 2 | 

| B ,/2 | 


atau 


|S- 


' b| = h' b| 


1 


p 

n b i 


_ i =1 

W' 

B 

B 


Kombinasikan hasil teras dan determinan, 
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-tr\L 1 B\/ 2 

e 


(p Y’ 

n 

v ' =1 y 


p 

-Z ?//2 

, ?=i 


B «=i 


b -m/2 


Tetapi fungsi i^e'" 172 telah maksimum, dengan respek pada rj, dari (2b) b e' b , 
terjadi pada r|=2b. Pemilihan rji = 2b, untuk setiap I, memberikan : 

_L e -tra~h/2 <_}_ {2b) pb e -bp 
|S|* \B\ b 

Batas atas yang unik dicapai ketika S = ( l/2b)B. Pilihan ini mengakibatkan 
Bi/2 2 -i bi/ 2 = B 1 / 2 (2b)B 1 B 1 / 2 = (2b) I 

pxp 

dan 

Tr [Z' 1 B] = tr [B 1 / 2 Z' 1 B 1 / 2 ] = tr [(2b)lj = 2bp 

Lebih jauh lagi, 


1 


_ pb)i\ 

z ~~ 

B 

\b\ 


(2 b) p 

\b\ 


Substitusi untuk tr [Z' 1 B] dan 



menghasilkan batas tesebut. Penduga 


maksimum likelihood untuk nilai ji dan Z dinotasikan oleh judanlL akan 
tergantung pada nilai Xi, X 2 , X 3 , ... , X n yang diobservasi melalui ringkasan 

statistik X dan S. 


Misalkan Xi, X 2 , X 3 , ... , X n contoh acak dari populasi normal ganda 

A - 

dengan rata-rata n dan covariance 2. Maka ju = X dan 
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adalah penduga-penduga 


A i n - - , (n-V) 

Z = -Z(X j -X)(X j -X) 

n j= i n 

maksimum likelihood dari ji dan Z. Nilai observasinya X dan 

1 / n - - , 

(/ )H(X; -X)(X f -X) ) disebut juga penduga maksimum likelihood 
/n j=i 

dari jj, dan Z. 

Bukti 

Fungsi likelihood eksponen bagian dari fungsi multiplicative faktor -1/2 
adalah 


fr[Z 1 (i(X j -X)(X j -X) , )] + «(Z-//)'2; 1 (X-//)>0 bila M = X . 


Jadi likelihood dimaksimumkan dengan menduga ju = X . Dianggap 
maksimumkan : 


A 1 -fr[2 _1 ( i (Xj-X)(Xj-X))]/2 

L(/u, S) =- —e 7=1 overZ. 

(2x) np/2 lEp 


« . 

Dengan b = n/2 dan B = £(X. ~X)(X i -X) . Maksimum terjadi pada 

7=1 

saat 

7 " 7=1 
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3.11. Sebaran Penarikan Contoh dari X dan S 

Dalam kasus univariate (p=l) / kita tahu bahwa sebaran dari x adalah 
normal dengan rataan ji dan ragam a 2 /n. Hal ini juga berlaku untuk kasus 

multivariate (p>2) dimana vektor rataan X menyebar normal dengan 
rataan ji dan matriks kovarian (1/n) Z. 

n _ 

Ragam contoh (n — l)S 2 = — x) 2 menyebar khi-kuadrat dengan 

j =i 

derajat bebas n-1. Sebaran khi-kuadrat ini merupakan sebaran dari 
jumlah kuadrat peubah acak normal yang saling bebas, dimana (n-l)S 2 
merupakan penjumlahan dari: 

a 2 (Zi 2 + ... + Zn-i 2 ) = (aZi) 2 + ...+ (aZn-i) 2 

lebih khusus lagi (cZi) adalah menyebar bebas dari N(0, a 2 ). Ini 
merupakan bentuk umum sebaran percontohan dari unsur-unsur matriks 
kovarian. 

Sebaran penarikan contoh dari matriks kovarian disebut sebaran Wishart, 
W m (. 11) = sebaran Wishart dengan db = m 
= sebaran dari Z ZjZj’ 

dimana Zj menyebar saling bebas yang merupakan bagian dari Np (0, Z) 
maka kesimpulan sebaran penarikan contoh adalah : 

Ambil x/, x2, ..., xn sebagai contoh acak yang berukuran n dari sebuah 
populasi normal ganda p dengan rataan ju dan matriks kovarian I, 
kemudian : 

1. X adalah menyebar Np (ji, (1 /n) Z) 

2. (n-1 )S adalah menyebar Wishart dengan db = n - 1 

3. X dan S adalah bebas. 
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Karena I tidak diketahui, sebaran X tidak dapat digunakan langsung 
untuk membuat turunan \x. Sebagaimana S memberikan informasi bebas 
tentang S dan distribusi S tidak bergantung pada ja. 

Hal-hal yang diperlukan dari sebaran Wishart: 

1. Jika Ai menyebar Wmi (Ai| I) bebas dari A 2 , yang menyebar Wm 2 (A 2 I 
S ), maka Ai + A 2 menyebar W m i+m 2 (Ai + A 2 I Z 

2. Jika A menyebar W m (A| S ), maka CAC’ menyebar W m (CAC’|CEC’). 

Fungsi kepekatan tidak ada jika ukuran contoh n tidak lebih besar dari 
jumlah peubah (p). Jika ada maka sebaran Wishartnya adalah : 

\^\(n-p-2)/2 ^_ trAIi -i/ 2 

W„_ 1 <A|S) =-U- ? - 

i =1 

dimana matriks A definit positif dan r (.) adalah fungsi Gamma. 

3.12. Latihan 

1. Angaplah vector peubah acak X menyebar normal ganda dengan 
N e (ix, 2), dengan |x'=[l,-5, 1 ] dan 

"1 5 f 
2= 5 3 2 
1 2 2 

a. Carilah sebaran dari Xi-2X2+X3 

PG 

b. Carilah vector a, sehingga X l —X 2 danX 2 —a' saling 

\_X 3 _ 

bebas 

2. Misalkan Y menyebar normal ganda dengan N 0 (u, S), dengan 
n’=[2,-3,4j dan 
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"4 -3 0" 

S= -3 6 0 

0 0 5 

Manakah dari peubah-peubah berikut yang saling bebas? 

a. yi dan y 2 

b. yi dan y3 

c. y 2 dan y3 

d. (yuy2)dany3 

e. (yi,y3)dany2 
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4 


4.lnferensia Vektor Nilai Tengah (Inference o f 
mean vector ) 


4.1. Pendahuluan 

Analisis statistika dapat dikategorikan menjadi dua yaitu statistika deskriptif 
dan statistika inferensia sebagian besar analisis statistika berkaitan dengan 
inferensia, yaitu menarik kesimpulan yang valid berdasarkan informasi dari 
sampel atau contah. 

Sebelumnya telah kita pelajari mengenai inferensia nilai tengah dari suatu 
populasi. Pada makalah ini akan dibahas tentang inferensia tentang 
vektor nilai tengah dari sebaran normal ganda. Dalam menyelesaikannya 
kita menganalogikan dengan sebaran normal tunggal yang telah kita 
pelajari. 

4.2. Test hipotesis vektor rataan 

Suatu nilai jao dianggap sebagai dugaan dari rataan populasi. Dari sisi 
pengujian dapat dituliskan sebagai berikut: 

Ho: |i = [io dan Hi : 
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Dimana Ho adalah hipotesis awal dan Hi adalah hipotesis alternatif. Jika 
XI, X2,..., Xn menotasikan contoh acak dari sebuah populasi normal, 
statistik uji yang dipakai adalah : 

Statistik uji di atas memiliki distribusi t-student dengan derajat bebas n-1. 
Kita menolak HO, yaitu menyatakan jao bukan nilai yang tepat untuk 
menduga n jika nilai |t| amatan lebih besar dari sebuah titik yang sudah 
ditentukan dari sebaran t dengan derajat bebas n-1. 

Menolak HO ketika 111 besar setara dengan menolak HO jika 
kuadratnyacukup besar, yaitu 

Peubah T 2 adalah jarak kuadrat dari rataan contoh ke nilai uji jio. Unit-unit 
jarak diekspresikan dengan simpangan baku dugaan dari rataan contoh. 

Apabila rataan contoh dan ragam sudah didapat dari perhitungan, 
pengujiannya adalah menolak HO dan menerima Hl pada taraf nyata a 
jika : 

Dimana tn-1 ((/2) menotasikan persentil 100((/2) persentil atas dari sebaran 
t dengan derajat bebas n-1. 

Jika HO tidak ditolak, maka (0 adalah nilai yang dapat diterima untuk 
menduga rataan populasi normal. 

Untuk pengujian hipotesis diatas, selang kepercayaan untuk \i adalah: 

Selang kepercayaan memuat semua nilai jao yang akan diterima pada 
pengujian hipotesis. 

Dalam menentukan apakah suatu vektor jio p x q adalah nilai yang dapat 
diterima untuk rataan dari sebuah sebaran normal peubah ganda. 

Generalisasi dari jarak dengan analogi peubah ganda adalah 
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Jika nilai T 2 terlalu besar, dimana nilai rataan populasi terlalu jauh dari nilai 
rataan dugaan, maka hipotesis awal (Ho) ditolak. 

T 2 sebarannya adalah (n-1 )p/(n-p) Fp, n -p dimana F p , n - P menotasikan sebuah 
peubah acak dengan sebaran F yang memiliki p dan n-p peubah bebas. 

Pada uji hipotesis Ho : pi = jao lawan Hi : jj, * jio pada taraf nyata a, tolak Ho 
jika : 

Sebuah daerah kepercayaan 100(1 -a)% dari sebuah rataan sebaran 
normal dimensi p ditentukan oleh semua ji adalah : 

Karena hal di atas dapat dianalogikan dengan uji hipotesis, dapat dilihat 
bahwa daerah kepercayaan di atas mengandung semua vektor pio 
dimana uji T 2 tidak akan menolak Ho pada taraf nyata a. 


Untuk dimensi yang lebih dari 4, daerah kepercayaan gabungan untuk ji 
tidak dapat digambarkan, tetapi panjang relatif dari sumbu-sumbu dari 
selang kepercayaan dapat dihitung. Hal tersebut ditentukan dari akar 
dan vektor ciri dari S. Arah dan panjang dari sumbu daerah kepercayaan 
ditentukan dari: 


a / v / Jn = l}p,n-p - p) 


Unit sepanjang vektor ciri ei. Berawal dari pusat rataan, sumbu-sumbu dari 
elipsoid kepercayaan adalah : 



P(n- 1 ) 
n(n - p) 


P,n-p 



Selang kepercayaan untuk peubah ke-p adalah : 




P(n-V F iy'rPP 
(n-p) ^ 


70 



Metode alternatif untuk perbandingan berganda adalah dengan 
menggunakan metode Bonferroni 


Dimana m=banyaknya selang kepercayaan selang kepercayaan yang 
akan dibuat. 


x ± t 


r a 
v 2 m 



Teladan: 


Data diperoleh dari 87 mahasiswa, Xi= sosial scien and history , X 2 = verbal 
dan X 3 = Science, dari data diketahui 


'526.586' 


'500 


'5808.06 

597.84 

222.92' 

54.690 

* /^o = 

50 

, 5 = 

597.84 

126.05 

22.96 

. 25.92 . 


. 30 . 


. 22.92 

22.96 

22.94. 


s - 1 


0.0004387 -0.0015949 -0.0026660 

-0.0015949 0.0154997 -0.0000143 

-0.0026660 -0.0000143 0.0694983. 


T 2 hitung — n (x - jio) ’ S -1 (x-jj,o) — 228.266 


Hipotesa yang ingin diuji adalah: 

Ho: |i = (500 50 30)’ 

Hi (500 50 30)’ 

Nilai T 2 hitung, yang sudah diperoleh selanjutnya dibandingkan dengan nilai 
T 2 tabel, yang dapat diperoleh dari konversi dengan nilai F, yaitu: 

7 (n-l)p (87- 1)3 258 

T 2 =—yFvin-v) = 87 _ 3 F 3X 87-3) = W F 3M = 3,07(2,71) = 8,33 

T 2 tabel < T 2 hitung, dengan demikian dapat disimpulkan tolak Ho. 
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4.3. Aplikasi SAS 


Berikut adalah contoh program untuk pengujian dua vektor rataan 
menggunakan PROC IML. 


data X1X2; 
input xl x2; 
cards ; 


3.7 

48.5 

5.7 

65.1 

3.8 

47.2 

3.2 

53.2 

3.1 

55.5 

4.6 

36.1 

2.4 

24.8 

7.2 

33.1 

6.7 

47.4 

5.4 

54.1 

3.9 

36.9 

4.5 

58.8 

3.5 

27.8 

4.5 

40.2 

1.5 

13.5 

LO 

00 

56.4 

4.5 

71.6 

6.5 

52.8 

4.1 

44.1 

5.5 

40.9 


proc iml ; 

TITLE1 'uji dua vektor' ; 

USE X1X2; 

read all var {xl x2 } into xx; 
u0= { 4 , 50 }; 
xr=xx[:,]; 

*hitung matriks peragam; 
n=nrow(xx); 
satu=repeat (1, n, 1) ; 

I0=i (n)- (1/n) #(satu*satu N ); 
s=(l/(n-1) )#(xx'*iO*xx); 
is=inv(s); 

*hitung t2; 

T2=n#(xr'-uO) '*is* (xr'-uO); 
print T2; 
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* nilai kritis; 
p=ncol(xx); 
alpha=0 . 1; 

F = FINV (1-alpha, p,n-p); 
nk=( (n-1 )#p/(n-p))#F; 
print n p f nk; 
if T2>nk then 

print 'T2 > nilai kritis'; 
else 

print 'T2 < nilai kritis'; 

*buat titik kordinat ellips; 
call eigen(val , vec,s); 
print val vec; 

*sumbu mayor; 

mayor=sqrt(val [ 1 ] )*sqrt(nk/n); 
minor=sqrt(val [ 2 ] )*sqrt(nk/n); 
print mayor minor; 

quit; 


4.4. Latihan 

1. Suatu perusahaan memproduksi sabun dengan dua metode yang 
berbeda untuk memilih metode produksi yang terbaik dilakukan 
pengamatan terhadap 50 buah sabun untuk setiap metode. 
Karaketeristik sabun yang diamati antara lain Xi = lather dan 
X2=mildness. Ringkasan datanya diperoleh sebagai berikut: 



'8.3' 


'3 1' 


'10.0' 


'2 1' 

t = 

4.0 


1 6 

, 

3.90 

, S 2 — 

1 4 


Asumsi: Semua kondisi di luar metode dikondisikan homogen 

a. Buatlah selang kepercayaan 95% simultan untuk beda nilai 
tengah kedua metode. Lengkapi dengan gambar elipsnya 

b. Ujilah apakah vector rata-rata penggunaan energi kedua 
wilayah sama pada taraf nyata 5% 
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2. Empat puluh sembilan (49) orang dari Indonesia dan 47 orang dari 
Malaysia yang diukur karakteristik personalnya. Beberapa variable 
yang mewakili karakteristik personal adalah : 

XI = daya tangkap terhadap informasi lisan 

X2 = daya tangkap terhadap informasi arah 

X3 = daya tangkap terhadap informasi aritmatika 

X4 = daya tangkap terhadap informasi gambar 


Data rata-rata yang ditunjukkan oleh dua grup adalah sebagai 
berikut: 



Matriks Kovariannya adalah sebagai berikut 


11.26 9.41 7.15 3.38 

13.53 7.38 2.51 

11.58 2.62 
5.81 
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Kebalikan matriks kovariance adalah sebagai berikut: 


S‘ 1 = 


0.2598 -0.1365 -0.0587 
0.1867 -0.0383 

0.1510 


-0.0659 

0.0162 

-0.0173 

0.2111 


Apakah karakteristik personal orang indonesia sama dengan 
karakteristik personal orang malaysia. Gunakan alpha 5 %. 

3. Suatu percobaan terhadap 11 rokok yang diukur kadar tar dan kadar 
nikotin. Sebelum diberi filter rokok-rokok tersebut diisap dan diukur 
kadar tar dan kadar nikotinnya pada asap yang tersedot. Selanjutnya 
pada rokok-rokok tersebut dipasang filter dan rokok diisap dengan 
kondisi asap melewati filter tersebut. Asap rokok yang melewati filter 


diukur kadar tar dan nikotinnya. Data adalah sebagai berikut: 



Rokok sebelum 

Rokok setelah 

No 

dipasang filter 

dipasang filter 

Kadar Tar 

Kadar 

Nikotin 

Kadar Tar 

Kadar 

Nikotin 

1 

28 

13 

6 

23 

2 

25 

15 

6 

27 

3 

35 

29 

8 

44 

4 

36 

22 

18 

64 

5 

44 

64 

34 

75 

6 

15 

31 

11 

30 

7 

42 

30 

28 

26 

8 

54 

64 

71 

124 

9 

29 

20 

33 

30 

10 

34 

56 

43 

54 

11 

39 

21 

20 

14 







Apakah kadar tar dan nikotin rokok sama antara tanpa filter dengan 
diberi filter ? Gunakan alpha 5 %. 
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5 


S.Manova (Multivariate Analysis ofVariance) 


5.1. Pendahuluan 

Pada dasarnya analisis ragam peubah ganda {multivariate analysis of 
variance atau manova ) merupakan pengembangan lebih lanjut dari 
analisis ragam satu peubah (anova). Berikut ini beberapa perbedaan 
dari kedua analisis tersebut: 


Analisis Ragam Satu Peubah 

(Anova) 

Analisis Ragam Peubah Ganda 

(Manova) 

Hanya mengkaji pengaruh 

berbagai per-cobaan yang 

dilakukan terhadap respon tunggal 
(satu buah peubah respon). 

Mengkaji pengaruh dari 

berbagai perla-kuan yang 
dicobakan terhadap respons 
ganda (lebih dari satu peubah 
respon). 

Ketergantungan di antara peubah 
respon tidak menjadi perhatian 
utama karena pada dasarnya 
dianggap bahwa peubah-peubah 
respons itu saling bebas satu sama 
lain , sehingga pengkajian struktur 
keragaman hanya dilakukan 

terhadap setiap peubah respons 
secara terpisah. 

Mempertinbangkan adanya 

ketergan-tungan antar peubah- 
peubah respons, sehingga baik 
dugunakan untuk pengkajian 
pengaruh dari berbagai 

perlakuan terhadap lebih dari 
satu respons. 
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5.2. Analisis Ragam Peubah Ganda Satu Arah (One- 
way Manova) 

Analisis ragam peubah ganda satu arah merupakan pengembangan 
dari analisis ragam satu peubah satu arah. Oleh sebab itu, sebelum 
membahas analisis ragam peubah ganda satu arah perlu dikemukakan 
tentang analisis ragam satu peubah satu arah. 

Model yang sering digunakan dalam analisis ragam satu arah adalah 
model Rancangan Acak Lengkap (RAL). 

Y ij = M + T i + Sij 

di mana: /'= 1,2,..., f. j = 1 , 2, ... , m. 

Y t j = nilai pengamatan (respon tunggal) dari ulangan ke-j yang 
memperoleh perlakuan ke-i. 

/d - nilai rataan umum. 

T t = pengaruh dari perlakuan ke-i terhadap respon. 

s { j - pengaruh galat yang timbul pada ulangan ke-j dan perlakuan 
ke-i. 

Asumsi yang diperlukan pada analisis ragam satu peubah adalah : 

=0 dan s-j - N (0, a 2 ) 

Dalam analisis ragam satu peubah, pengujian hipotesis dilakukan 
terhadap adanya pengaruh perlakuan , di mana: 
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H 0 :r l =t 2 = ••• = r f = 0 

atau tidak terdapat pengaruh dari semua perlakuan yang 
diterapkan terhadap respon yang diamati. 

H x : 3 /, r i ^ 0, i = 1,2, • • •, t 


atau paling sedikit ada satu perlakuan yang mempengaruhi respon 
yang diamati. 

Jika kita ingin mengkaji pengaruh dari t buah perlakuan terhadap p 
buah respon secara serempak, di mana p > 1, maka penelitian itu dapat 
dianalisis dengan analisis ragam peubah ganda satu arah. 

Model umum dari analisis ragam peubah ganda satu arah adalah 

Y ijk = Mk +T ik+ £ ijk 

di mana: /=1,2, /=1,2, ... , m, k=l, 2, ... , p. 

Y iJ k = nilai pengamatan dari respon ke-k dan ulangan ke-j yang 
memperoleh perlakuan ke-i. 
ju k = nilai rataan umum dari respon ke-k. 

T ik = pengaruh dari perlakuan ke-i terhadap respon ke-k. 
s t j k = pengaruh galat yang timbul pada respon ke-k dari ulangan ke-j 
dan perlakuan ke-i. 

Asumsi yang dibutuhkan dalam analisis ragam peubah ganda satu arah 
adalah nilai-nilai galat bersifat bebas dan menyebar normal ganda 
dengan vektor nilai rata-rata 0 dan matriks peragam Z ( s ijk ~ N p (0, Z)). 

Ilustrasi: 

Seorang peneliti bidang kedokteran melakukan percobaan untuk 
meneliti hubungan di antara aktifitas metabolik di antara kelinci-kelinci 
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percobaan dan daya tahan terhadap kuman tuberculosis (tbc). Peneliti 
menetapkan 4 perlakuan sebagai berikut: 


Pi = kontrol (tidak divaksinasi) 

P 2 = diinfeksi (ditularkan) kuman tbc selama aktifitas metabolik 
rendah. 

P 3 = diinfeksi (ditularkan) kuman tbc selama aktifitas metabolik tinggi. 

P 4 = diinfeksi (ditularkan) kuman tbc selama aktifitas metabolik 
normal, tetapi terlebih dahulu diirradiasi dengan 400 rontgens. 

Perlakuan Pi dan P 2 diulang sebanyak 7 kali (n 1 = m = 7), perlakuan P 3 
diulang 5 kali (m = 5), dan P 4 diulang sebanyak 2 kali (m = 2). Peubah 
respon yang diamati ada 2 yaitu: 

Yi = banyaknya basil yang hidup per tubercle formed (mm). 

Y 2 = banyaknya basil yang hidup per tubercle size (mm). 

Data hasil pengamatan seperti pada tabel di bawah ini. 

Banyaknya Basil yang Hidup per Tubercle Formed (Yi) dan Tubercle Size 
(Y 2 ) dalam mm 


Ulangan 

Pi 

F 

2 

F 

3 

F 

4 

Y 1 

y 2 

Y 1 

y 2 

Y 1 

y 2 

Y 1 

y 2 

1 

24.0 

3.5 

7.4 

3.5 

16.4 

3.2 

25.1 

2.7 

2 

13.3 

3.5 

13.2 

3.0 

24.0 

2.5 

5.9 

2.3 

3 

12.2 

4.0 

8.5 

3.0 

53.0 

1.5 



4 

14.0 

4.0 

10.1 

3.0 

32.7 

2.6 



5 

22.2 

3.6 

9.3 

2.0 

42.8 

2.0 



6 

16.1 

4.3 

8.5 

2.5 





7 

27.9 

5.2 

4.3 

1.5 





Total 

129.7 

28.1 

61.3 

18.5 

168.9 

11.8 

31.0 

5.0 

Rata-rata 

18.5286 

4.0143 

8.7571 

2.6428 

33.7800 

2.3600 

15.5000 

2.5000 
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Analisis ragam peubah ganda satu arah untuk data di atas dilakukan 
sebagai berikut: 

• Perhitungan Faktor Koreksi (FK) untuk untuk respon Yi dan Y2 
FK untuk respon Yi 

FK X j = v = ^ 9 °' 9 ^ = 7276.3243 
n 21 

FK untuk respon Y2 

FK 22 = * 2 **^ = ^ ^ = 191.4076 

n 21 

FK untuk respon Yi dan Y2 

FK{2 _ «909>ii; = , 1801457 

n 21 

• Perhitungan Jumlah Kuadrat Total Terkoreksi (JKT) dan Jumlah Hasil 
Kali Total Terkoreksi (JHKT) untuk respon Yi dan Y2 

JKT untuk respon Yi 

^11=11^-^,1=3152.2657 

i =1 7=1 

JKT untuk respon Y2 

JKT 22 = 11^ -FK 22 =17.4124 

i=l M 
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JHKT untuk respon Yi dan Y 2 


4 m 


JHKT n = -Y 2I j -FK i2 = -39.0257 

i= 1 .H 


Dari hasil perhitungan untuk komponen total, maka dapat dibentuk 
suatu matriks T yang memuat elemen-elemen JKT dan JHKT yang 
berkaitan dengan respon Yi dan Y 2 , sebagai berikut: 


T = 


^3152.2657 -39.0257" 
v -39.0257 17.4124, 


• Perhitungan Jumlah Kuadrat Perlakuan Terkoreksi (JKP) dan Jumlah 
Hasil Kali Perlakuan Terkoreksi (JHKP) untuk respon Yi dan Y2 


JKP untuk respon Yi 


4 y 2 

JKP l x =Y, — -FK n =\ 849.5862 

«=i w,- 


JKP untuk respon Y2 


4 y 2 

JKP 22 =Yj— 

i=1 n i 


FK- 


22 


= 10.6346 


JHKP untuk respon Yi dan Y 2 


JHKP l2 = Y — - FK n = -21.3810 

i =1 'h 
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Dari hasil perhitungan untuk komponen perlakuan, maka dapat 
dibentuk suatu matriks P yang memuat elemen-elemen JKP dan JHKP 
yang berkaitan dengan respon Yi dan Y 2 , sebagai berikut: 


p 


1849.5862 

-21.3810 


-21.3810" 

10.6346, 


• Perhitungan Jumlah Kuadrat Galat (JKG) dan Jumlah Hasil Kali Galat 
(JHKG) untuk respon Y i dan Y2 

JKG untuk respon Yi 

JKG,, = JKT t 1 - JKP ,! =1302.6795 

JKG untuk respon Y 2 

JKG 22 = JKT 22 -JKP 22 = 6.7778 

JHKG untuk respon Yi dan Y 2 

JHKG n = JHKT n - JHKP l2 = -17.6447 

Dari hasil perhitungan untuk komponen galat, maka dapat dibentuk 
suatu matriks G yang memuat elemen-elemen JKG dan JHKG yang 
berkaitan dengan respon Yi dan Y 2 , sebagai berikut: 

fl 3026795 -17.6447"} 

G 

17.6447 6.7778 J 

Hasil perhitungan yang diperoleh sebelumnya dapat dirangkum 
dalam suatu tabel analisis ragam peubah ganda satu arah (One-way 
Manova ) seperti berikut: 
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Tabel Analisis Ragam Peubah Ganda Satu Arah (One-way /Vlanova) 


Sumber 

Keragaman 

Derajat Bebas 
(db) 

JK dan JHK 

Perlakuan (P) 

3 

p= 

^1849.5862 -21.3810^ 
21.3810 10.6346, 


Galat (G) 

17 

G = 

"13026795 -17.6447^ 
-17.6447 6.7778, 


Total (T) 

20 

T = 

"31522657 -39.0257" 
v - 39.0257 17.4124, 



Untuk menguji hipotesis yang telah dikemukakan sebelumnya, maka kita 
dapat menggunakan uji Lambda-Wilks ( A-Wilks ), sebagai berikut: 

l G l _ l G l 

~|G + P| ~Jf\ 

di mana: 

|G| = determinan dari matriks galat (G) 

|T| = determinan dari matriks total (T) 

Selanjutnya besaran A yang dihitung dari rumus di atas dibandingkan 
dengan tabel distribusi U dengan kaidah keputusan sebagai berikut: 

jika A { > U '' :dh ' >:db o imka terima H ° 

{ ^ u a P ;dbp;dbG maka tola k H 0 

di mana: 

p = banyaknya peubah respon yang diamati. 
dbp = derajat bebas perlakuan. 
dbG = derajat bebas galat. 
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Untuk kasus di atas maka berdasarkan hasil perhitungan yang telah 
dirangkum dalam tabel Manovo didapat IgI = 8517.9657 dan 


T = 53365.5060, sehingga besaran Lambda-Wilks dapat dihitung 


sebagai berikut: 



8517.9657 

53365.5060 


= 0.1596 


Dalam kasus ini, p=2, dbp= 3, dan dbG=17. Jika kita menetapkan taraf 
nyata pengujian hipotesis adalah a = 0.01, maka dari tabel distribusi U 

didapat bahwa U 2 . 3 1 17 = 0.370654. Karena A = 0.1596 <^'. 3^7 = 

0.370654 maka sesuai dengan kaidah keputusan di atas maka Ho ditolak. 
Dengan demikian dapat disimpulkan bahwa terdapat perbedaan daya 
hidup basil di antara keempat perlakuan, atau vektor nilai rata-rata 
berbeda di antara empat perlakuan yang dicobakan. 

Kita juga dapat melakukan transformasi dari besaran A ke besaran 
statistik F sehingga dapat dibandingkan dengan tabel distribusi F. Bentuk 
transformasi dari nilai A ke nilai F untuk berbagai kombinasi jumlah 
peubah (p) dan derajat bebas perlakuan (db P ) disajikan dalam tabel. 

Dalam kasus di atas, p=2, dbp= 3, hal ini berarti sesuai dengan kriteria 
transformasi F untuk p=2 dan dbp> 1, sehingga transformasi dari A ke F 
dapat dilakukan sebagai berikut: 


ri-vri 

db G -l') 

v , 

v db P / 


8.017 


Selanjutnya besaran F ini dibandingkan dengan nilai dari tabel F dengan 
derajat bebas 2 dbp;2(dbG -1). Jika kita menetapkan a=0.01, maka 
Fo.cn ;6;32 = 3.434. Karena besaran F = 8.017 > Fo.oi; 6;32 = 3.434, maka kita 
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menolak Ho pada taraf a=0.01. Dengan demikian terlihat bahwa hasil 
pengujian berdasarkan statistik F sama dengan statistik Lombdo-Wilks. 


Tabel Transformasi dari A ke F 


Parameter 

Transformasi F 

Derajat Bebas 

P 

dbp 

1 

> 1 


f 1-A l 

f dbA 

dbp;dbG 

l A J 

\db P J 

2 

> 1 


r i- -s/a 

db G -l') 

2 dbp;2(dbG -1) 

v Va , 

^ dbp j 

> 1 

1 


(l-A) 

' db P +db G - p^\ 

p; (dbp + dbG - p) 

{ A J 

P J 

> 1 

2 


ri-vTj 

ab P +db G 

2p;2(dbp + dbG - p 

-i) 

Ja j 

_ p _ L 


5.3. Analisis Ragam Peubah Ganda Dua Arah (Two- 
way Manova) 

Seperti halnya analisis ragam peubah ganda satu arah, analisis ragam 
peubah ganda dua arah juga merupakan pengembangan lebih lanjut 
dari analisis ragam satu peubah dua arah (Two-way Anovo). 

Model yang sering digunakan dalam analisis ragam satu peubah dua 
arah adalah Roncongan Acak Kelompok (RAK). 
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Y ij - M + T i + P j + £ ij 


di mana: /=1,2,..., t; / = 1,2, ... ,r 

Y t j = nilai pengamatan (respon tunggal) dari kelompok ke-j yang 
memperoleh perlakuan ke-i. 

/d - nilai rataan umum. 

r t = pengaruh dari perlakuan ke-i terhadap respon. 

P j = pengaruh dari kelompok ke-j terhadap respon. 

s t j = pengaruh galat yang timbul pada kelompok ke-j yang 
memperoleh perlakuan ke-i. 


Dalam analisis ragam peubah ganda dua arah, model yang digunakan 
adalah : 


Y ijk - Mk +T ik+ P jk + s ijk 

di mana: / = 1,2,... , f; j =1,2, ...,r ; k =1,2, ...,p. 

Y i Jk = nilai pengamatan dari respon ke-k dan kelompok ke-j yang 
memperoleh perlakuan ke-i. 

ju k = nilai rataan umum dari respon ke-k. 

T ik = pengaruh dari perlakuan ke-i terhadap respon ke-k. 

Pj k = pengaruh dari kelompok ke-j terhadap respon ke-k. 

Sij k = pengaruh galat yang timbul pada respon ke-k dari kelompok ke- 
j yang memperoleh perlakuan ke-i. 
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Asumsi yang diperlukan adalah nilai-nilai galat bersifat bebas dan 
menyebar normal ganda dengan vektor nilai rata-rata 0 dan matriks 
peraga m Z [s ijk ~ N p (0, Z)). 

Dalam analisis ragam peubah ganda dua arah, hipotesis yang diuji 
adalah : 



(t \ 

T \\ 


(t \ 
T 21 


(t } 

T tl 


^ 0 " 

H 0 : 

T 12 

= 

T 22 


T t2 

— 

0 


k Ti p 2 




J 


. 0 , 


atau tidak ada pengaruh perlakuan terhadap respons yang 
diamati. 


H x : 3 /, r ik ^ 0 ,i = 1,2, • • •, t dan k = 1,2, • • •, p 

atau paling sedikit ada satu perlakuan yang mempengaruhi respon 
pengamatan. 

Ilustrasi: 

Dari data yang mempunyai 3 peubah respon Yi, Y2, dan Y3, yang 
diamati dari 5 perlakuan yaitu Pi, P 2 , P 3 , P 4 , dan P 5 , yang dikenakan pada 
4 kelompok yaitu Ki, K 2 , K 3 , dan K 4 , seperti di bawah ini: 


87 



Data untuk Analisis Ragam Peubah Ganda Dua Arah 


Pe 

ria 

ku 

an 

Kelompok 1 

Kelompok 2 

Kelompok 3 

Kelompok 4 

Total 

Y i 

y 2 

y 3 

Y i 

y 2 

y 3 

Y i 

y 2 

y 3 

Y i 

y 2 

y 3 

Y i 

y 2 

y 3 

Pi 

96 

10 

725 

142 

16 

700 

122 

13 

655 

111 

13 

680 

417 

52 

2760 

P 2 

102 

15 

695 

106 

10 

710 

95 

14 

705 

93 

12 

680 

396 

51 

2790 

Ps 

109 

15 

690 

113 

15 

690 

101 

14 

680 

100 

19 

685 

423 

63 

2745 

P 4 

103 

17 

680 

97 

16 

690 

99 

13 

730 

135 

12 

670 

434 

58 

2770 

Ps 

98 

17 

680 

97 

14 

695 

105 

16 

680 

86 

22 

710 

386 

69 

2765 

To 

tal 

508 

74 

3470 

555 

71 

3485 

522 

70 

3450 

525 

78 

3425 

2110 

293 

13830 


Dapat disusun tabel Monovo sesuai dengan cara yang telah dijelaskan 
sebelumnya seperti berikut ini: 

Tabel Analisis Ragam Peubah Ganda Dua Arah 


Sumber 

Keragaman 

Derajat 

Bebas 

JKdan JHK 

Kelompok (K) 

3 

K = 

"234.60 -14.10 127.00' 

-14.10 7.75 -36.50 

v 127.00 -36.50 405.00 y 


Perlakuan (P) 

4 

P = 

f 1129.50 -125.75 -213.75" 

-125.75 57.30 -62.00 

v -213.75 -62.00 267.50 y 


Galat (G) 

12 

G = 

f 2258.90 -24.65 -1658.25' 
-24.65 91.50 4.00 

v -1658.25 4.00 5532.50 y 


Total (T) 

19 

T = 

' 3623.00 -164.50 -1745.00' 

-164.50 156.55 -94.50 

-1745.00 -94.50 6205.00, 
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Pengujian hipotesis dalam analisis ragam peubah ganda dua arah 
dapat menggunakan statistik Lombdo-Wilks sebagai berikut: 


G 

A = ' ' ; 

G + P 


8.888319xlO s 

2.227617xl0 9 


= 0.399006 


Selanjutnya besaran A dibandingkan dengan nilai U dari tabel distribusi U 
pada taraf nyata a dengan p=3, dbp-4, dbG= 12. Jika kita menetapkan 

a=0.05, maka dari tabel distribusi U diperoleh -0.168939. Karena 

A=0.399006 > =0.168939, maka kita menerima Ho, dan 

menyatakan bahwa berdasarkan data yang ada kita belum dapat 
menolak hipotesis kesamaan pengaruh perlakuan. 


5.4. Aplikasi SAS 

ANOVA adalah bagian dari prosedur statistika untuk membahas 
perbedaan rataan dari beberapa populasi menggunakan data contoh 
yang ditarik dari populasi yang bersesuaian. Ada banyak jenis Anova, 
mulai dari model satu arah (one-way), model dua arah dengan dan 
tanpa interaksi, rancangan dengan pengaruh acak, rancangan tak 
lengkap dan sebagainya. Anova hanya melibatkan satu peubah 
respon. Manova adalah perluasan konsep dan teknik ANOVA pada 
situasi ada beberapa peubah respon. Berikut disajikan ilustrasi 
penggunaan SAS untuk MANOVA. 


5.4.1. One-way Manova 

Seorang peneliti bidang kedokteran melakukan percobaan untuk 
meneliti hubungan di antara aktifitas metabolik di antara kelinci-kelinci 
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percobaan dan daya tahan terhadap kuman tuberculosis (tbc). Peneliti 
menetapkan 4 perlakuan sebagai berikut: 

P1 = kontrol (tidak divaksinasi) 

P2 = diinfeksi (ditularkan) kuman tbc selama aktifitas metabolik rendah. 
P3 = diinfeksi (ditularkan) kuman tbc selama aktifitas metabolik tinggi. 

P4 = diinfeksi (ditularkan) kuman tbc selama aktifitas metabolik normal, 
tetapi terlebih dahulu diradiasi dengan 400 rontgens. 

Perlakuan P1 dan P2 diulang sebanyak 7 kali (nl = n2 = 7), perlakuan P3 
diulang 5 kali (n3 = 5), dan P4 diulang sebanyak 2 kali (n4 = 2). Peubah 
respon yang diamati ada 2 yaitu: 

Y1 = banyaknya basil yang hidup per tubercle formed (mm). 

Y2 = banyaknya basil yang hidup per tube rcle size (mm). 


Datanya adalah sebagai berikut: 


Ulangan 

P1 

P2 

P3 

P4 

Y1 

Y2 

Y1 

Y2 

Y1 

Y2 

Y1 

Y2 

1 

24.0 

3.5 

7.4 

3.5 

16.4 

3.2 

25.1 

2.7 

2 

13.3 

3.5 

13.2 

3.0 

24.0 

2.5 

5.9 

2.3 

3 

12.2 

4.0 

8.5 

3.0 

53.0 

1.5 



4 

14.0 

4.0 

10.1 

3.0 

32.7 

2.6 



5 

22.2 

3.6 

9.3 

2.0 

42.8 

2.0 



6 

16.1 

4.3 

8.5 

2.5 





7 

27.9 

5.2 

4.3 

1.5 






Data tersebut terlebih dahulu dimasukkan dalam SAS data set sebagai 
berikut: 
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data 

basilus 

; 


titlel 

"Data Basilus"; 


input 

Perlakuan $ Y1 Y2 ; 


datalines ; 

P1 

24 

3.5 

P1 

13.3 

3.5 

P1 

12.2 

4 

P1 

14 

4 

P1 

22.2 

3.6 

P1 

16.1 

4.3 

P1 

27.9 

5.2 

P2 

7.4 

3.5 

P2 

13.2 

3 

P2 

8.5 

3 

P2 

10.1 

3 

P2 

9.3 

2 

P2 

8.5 

2.5 

P2 

4.3 

1.5 

P3 

16.4 

3.2 

P3 

24 

2.5 

P3 

53 

1.5 

P3 

32.7 

2.6 

P3 

42.8 

2 

P4 

25.1 

2.7 

P4 

5.9 

2.3 

proc 

glm data=basilus; 


class 

Perlakuan; 


model 

Yl Y2 = Perlakuan; 


manova 

h= all / printe printh; 

run; 



Dengan menggunakan PROC GLM diperoleh hasil sebagai berikut: 

Data Basilus 

The GLM Procedure 
Class Level Information 


Class Levels Values 

Perlakuan 4 P1 P2 P3 P4 




Number of Observations 

Read 

21 



Number of Observations 

Used 

21 

Dependent 

Variable: 

Yl 

Sum of 



Source 


DF 

Squares 

Mean Square 

F Value Pr > 

Model 


3 

1849.586286 

616.528762 

8.05 0.0015 

Error 


17 

1302.679429 

76.628202 


Corrected 

Total 

20 

3152.265714 




R-Square 

Coeff Var 

Root MSE 

Yl Mean 


0.586748 

47.02707 

8.753754 

18.61429 


Source DF 

Type I SS 

Mean Square 

F Value 

Pr > F 

Perlakuan 

3 1849.586286 

616.528762 

8.05 

0.0015 

Source DF 

Type III SS 

Mean Square 

F Value 

Pr > F 
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Perlakuan 


3 

1849.586286 

616.528762 

8.05 

0.0015 

Dependent 

Variable: 

Y2 


Sum 

Of 



Source 



DF 

Squares 

Mean Square 

F Value Pr > F 

Model 



3 

10.63466667 

3.54488889 

8 

.89 0.0009 

Error 



17 

6.77771429 

0.39868908 



Corrected 

Total 


20 

17.41238095 





R-Square 

Coeff Var 

Root MSE 

Y2 Mean 



0.610753 

20.91449 

0.631418 

3.019048 



Source 


DF 

Type I SS 

Mean Square 

F Value 

Pr > F 


Perlakuan 


3 

10.63466667 

3.54488889 

8.89 

0.0009 


Source 


DF 

Type III SS 

Mean Square 

F Value 

Pr > F 


Perlakuan 


3 

10.63466667 

3.54488889 

8.89 

0.0009 





E = Error SSCP Matrix 







Y1 

Y2 





Y1 


1302.6794286 

-17.644 




Y2 


-17.644 

6.7777142857 



Pantial Correlation Coefficients from the Error SSCP Matnix / Prob > |r| 


DF = 17 


Y1 


Y2 


Y1 


Y2 


1.000000 -0.187775 

0.4556 

-0.187775 1.000000 

0.4556 


H = Type III 


SSCP Matrix for Perlakuan 


Y1 


Y2 


Y1 1849.5862857 -21.38171429 

Y2 -21.38171429 10.634666667 


Characteristic Roots and Vectors of: E Inverse * H, where 
H = Type III SSCP Matrix for Perlakuan 
E = Error SSCP Matrix 


Characteristic 

Root 


Characteristic Vector V'EV=1 
Percent Y1 Y2 


1.59856728 53.12 

1.41098630 46.88 


0.01118710 0.38173632 

0.02589504 -0.08492416 


MANOVA Test Criteria and F Approximations for the Hypothesis of No Overall 

Perlakuan Effect 

H = Type III SSCP Matrix for Perlakuan 
E = Error SSCP Matrix 


S=2 M=0 N=7 


Statistic Value F Value Num DF Den DF Pr > F 


Wilks' Lambda 

0.15961411 

8.02 

6 

32 

<.0001 

Pillai's Trace 

1.20040454 

8.51 

6 

34 

<.0001 

Flotelling-Lawley Trace 

3.00955358 

7.82 

6 

19.652 

0.0002 

Roy's Greatest Root 

1.59856728 

9.06 

3 

17 

0.0008 
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NOTE: F Statistic for Roy's Greatest Root is an upper bound. 
NOTE: F Statistic for Wilks' Lambda is exact. 


Berdasarkan keluaran SAS di atas diperoleh nilai statistic Wilks’ Lambda 
dengan p-value < .05. Ini menunjukkan bahwa cukup bukti untuk 
menolak Ho yang berarti bahwa minimal terdapat sepasang perlakuan 
yang memberikan pengaruh yang berbeda terhadap respon. 


5.4.2. Two Way Manova 


Berikut merupakan data hasil penelitian yang melibatkan lima perlakuan 
dengan empat kelompok. 


per 

lak 

ua 

n 

kelompokl 

Kelompok 2 

Kelompok 3 

Kelompok 4 

Y1 

Y2 

Y3 

Y1 

Y2 

Y3 

Y1 

Y2 

Y3 

Y1 

Y2 

Y3 

pl 

96 

10 

725 

142 

16 

700 

122 

13 

655 

111 

13 

680 

P2 

102 

15 

695 

106 

10 

710 

95 

14 

705 

93 

12 

680 

P3 

109 

15 

690 

113 

15 

690 

101 

14 

680 

100 

19 

685 

p4 

103 

17 

680 

97 

16 

690 

99 

13 

730 

135 

12 

670 

P5 

98 

17 

680 

97 

14 

695 

105 

16 

680 

86 

22 

710 

tot 

al 

508 

74 

3470 

555 

71 

3485 

522 

70 

3450 

525 

78 

3425 


Untuk mengetahui apakah ada pengaruh perlakuan terhadap respon, 

dengan menggunakan SAS perintahnya sebagai berikut: 

data rekaan; 

titlel "Data Rekaan"; 

input Kelompok $ Perlakuan $ Y1 Y2 Y3; 
datalines ; 


K1 

Pl 

96 

10 

725 

Kl 

P2 

102 

15 

695 

Kl 

P3 

109 

15 

690 

Kl 

P4 

103 

17 

680 

Kl 

P5 

98 

17 

680 

K2 

Pl 

142 

16 

700 

K2 

P2 

106 

10 

710 

K2 

P3 

113 

15 

690 

K2 

P4 

97 

16 

690 

K2 

P5 

97 

14 

695 


93 























K3 

P1 

122 

13 

655 

K3 

P2 

95 

14 

705 

K3 

P3 

101 

14 

680 

K3 

P4 

99 

13 

730 

K3 

P5 

105 

16 

680 

K4 

P1 

111 

13 

680 

K4 

P2 

93 

12 

680 

K4 

P3 

100 

19 

685 

K4 

P4 

135 

12 

670 

K4 

P5 

86 

22 

710 


proc glm data= 

rekaan; 


class 

Kelompok 

Perlakuan; 


model 

Y1 Y2 

Y3 

= Kelompok Perlakuan; 


manova 

run; 

l h=_all_ 

/ printe printh; 


Keluaran yang dihasilkan dari PROC GLM di atas adalah sebagai berikut: 


Data Rekaan 
The GLM Procedure 
Class Level Information 


Class 

Levels 

Values 


Kelompok 

4 

K1 K2 K3 

K4 

Perlakuan 

5 

P1 P2 P3 

P4 P5 


Number of Observations Read 
Number of Observations Used 


20 

20 


Dependent Variable: Y1 


Sum of 


Source 

DF 

Squares 

Mean Square 

F Value 

Pr > F 

Model 

7 

1364.100000 

194.871429 

1.04 

0.4562 

Error 

12 

2258.900000 

188.241667 



Corrected 

Total 19 

3623.000000 





R-Square Coeff Var 

Root MSE 

Y1 

Mean 


0.376511 13.00485 

13.72012 

105. 

,5000 

Source 

DF 

Type I SS 

Mean Square 

F Value 

Pr > F 

Kelompok 

3 

234.600000 

78.200000 

0.42 

0.7451 

Perlakuan 

4 

1129.500000 

282.375000 

1.50 

0.2634 
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Source 

DF 

Type III SS 

Mean Square 

F Value 

Pr > F 

Kelompok 

3 

234.600000 

78.200000 

0.42 

0.7451 

Perlakuan 

4 

1129.500000 

282.375000 

1.50 

0.2634 


Dependent Variable: Y2 




Source 

DF 

Squares 

Sum of 

Mean Square F Value 

Pr > F 

Model 

7 

65.0500000 

9.2928571 1.22 

0.3638 

Error 

12 

91.5000000 

7.6250000 


Corrected Total 

19 

156.5500000 





R-Square Coeff Var 

Root MSE 

Y2 

Mean 


0.415522 18.84874 

2.761340 

14.65000 

Source 

DF 

Type I SS 

Mean Square 

F Value 

Pr > F 

Kelompok 

3 

7.75000000 

2.58333333 

0.34 

0.7977 

Perlakuan 

4 

57.30000000 

14.32500000 

1.88 

0.1790 

Source 

DF 

Type III SS 

Mean Square 

F Value 

Pr > F 

Kelompok 

3 

7.75000000 

2.58333333 

0.34 

0.7977 

Perlakuan 

4 

57.30000000 

14.32500000 

1.88 

0.1790 


Dependent Variable: Y3 


Sum of 


Source 

DF 

Squares 

Mean Square 

F Value 

Pr > F 

Model 

7 

672.500000 

96.071429 

0.21 

0.9768 

Error 

12 

5532.500000 

461.041667 



Corrected Total 

19 

6205.000000 





R-Square 

0.108380 


Coeff Var 
3.105117 


Root MSE 
21.47188 


Y3 Mean 
691.5000 


Source 

DF 

Type I SS 

Mean Square 

F Value 

Pr > F 

Kelompok 

3 

405.0000000 

135.0000000 

0.29 

0.8298 

Perlakuan 

4 

267.5000000 

66.8750000 

0.15 

0.9617 


Source 

DF 

Type III SS 

Mean Square 

F Value 

Pr > F 

Kelompok 

3 

405.0000000 

135.0000000 

0.29 

0.8298 

Perlakuan 

4 

267.5000000 

66.8750000 

0.15 

0.9617 


The GLM Procedure 
Multivariate Analysis of Variance 

E = Error SSCP Matrix 


Y1 Y2 Y3 

Y1 2258.9 -24.65 -1658.25 


95 



Y2 

Y3 


-24.65 

-1658.25 


91.5 

4 


4 

5532.5 


Partial Correlation Coefficients from the Error SSCP Matrix / Prob > |r| 


DF = 12 

Y1 

Y2 

Y3 

Y1 

1.000000 

-0.054220 

0.8604 

-0.469073 

0.1059 

Y2 

-0.054220 

0.8604 

1.000000 

0.005622 

0.9855 

Y3 

-0.469073 

0.1059 

0.005622 

0.9855 

1.000000 


The GLM Procedure 
Multivariate Analysis of Variance 

H = Type III SSCP Matrix for Kelompok 

Y1 Y2 Y3 


Y1 

234.6 

-14.1 

127 

Y2 

-14.1 

7.75 

-36.5 

Y3 

127 

-36.5 

405 


Chanacteristic Roots and Vectors of: E Inverse * H, where 
H = Type III SSCP Matrix for Kelompok 
E = Error SSCP Matrix 

Characteristic Characteristic Vector V'EV=1 


Root 

Percent 

Y1 

Y2 

Y3 

0.26074591 

74.69 

0.01925198 

-0.03643290 

0.01169745 

0.06529416 

18.70 

0.01317611 

0.08381796 

-0.00042845 

0.02306344 

6.61 

-0.00502711 

0.05112645 

0.00973873 


MANOVA Test Criteria and F Approximations for the Hypothesis of No Overall 

Kelompok Effect 

H = Type III SSCP Matrix for Kelompok 
E = Error SSCP Matrix 



S=3 

M=-0.5 

N=4 



Statistic 

Value 

F Value 

Num DF 

Den DF 

Pr > F 

Wilks' Lambda 

0.72778034 

0.38 

9 

24.488 

0.9338 

Pillai's Trace 

0.29065442 

0.43 

9 

36 

0.9105 

Flotelling-Lawley Trace 0.34910352 

0.37 

9 

12.866 

0.9310 

Roy's Greatest Root 

0.26074591 

1.04 

3 

12 

0.4089 


NOT E: F Statistic for Roy's Greatest Root is an upper bound. 


H = Type III SSCP Matrix for Perlakuan 
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Y1 

Y2 

Y3 

Y1 

1129.5 

-125.75 

-213.75 

Y2 

-125.75 

57.3 

-62 

Y3 

-213.75 

-62 

267.5 


Chanacteristic Roots and Vectors of: E Inverse * H, where 
H = Type III SSCP Matrix for Perlakuan 
E = Error SSCP Matrix 


Characteristic Characteristic Vector V'EV=1 


Root 

Percent Y1 

Y2 

Y3 

0.91280518 

74.84 

0.01564533 

-0.07482267 

0.00527950 

0.29514853 

24.20 

0.01707089 

0.06744138 

0.00032600 

0.01165071 

0.96 

0.00577310 

0.02863476 

0.01427856 


MANOVA Test Criteria and F Approximations for the Hypothesis of No Overall 

Perlakuan Effect 

H = Type III SSCP Matrix for Perlakuan 



E = Error SSCP 

Matrix 




S=3 

M=0 

N=4 



Statistic 

Value 

F Value 

Num DF 

Den DF 

Pr > F 

Wilks' Lambda 

0.39900569 

0.93 

12 

26.749 

0.5366 

Pillai's Trace 

0.71661193 

0.94 

12 

36 

0.5186 

Hotelling-Lawley Trace 

1.21960442 

0.95 

12 

13.692 

0.5293 

Roy's Greatest Root 

0.91280518 

2.74 

4 

12 

0.0789 

NOTE: F Statistic for Roy's 

Greatest Root 

is an upper bound, 


5.5. Latihan 

1. Suatu percobaan dilakukan menggunakan 8 jenis pupuk. Pupuk- 
pupuk tersebut kemudian disebar pada petak-petak lahan yang 
ditanami padi. Karena lahan tidak homogen maka lahan di blok 
menjadi 8 blok. Setiap blok ada 8 petak. Pengacakan 8 perlakuan 
dilakukan pada setiap blok. Pada saat panen diukur bobot biji dan 
bobot serasak per petak. Matriks jumlah kuadrat adalah sebagai 
berikut: 
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P (Matriks Perlakuan)= 


12496.8 -6786.8 

-6786.8 32985.0 


B (Matriks Blok) = 


86045.8 56073.6 
56073.6 75841.5 


E (Matriks Galat) = 


136792.6 58549.0 
58549.0 71496.1 


Apakah ada pengaruh pemupukan terhadap respon ? (gunakan 
alpha 5 %). 

2. Suatu percobaan dilakukan untuk mengetahui perbedaan tiga 
varietas jagung. Data respon yang diambil antara lain Yi = Produksi 
per hektar, dan Y 2 = bobot/1000 butir. Rancangan lingkuan yang 
digunakan adalah rancangan acak lengkap. Datanya diperoleh 
sebagai berikut: 


Perlakuan 

Ulangan 

Yi 

y 2 

Varietas - 1 

1 

6 

7 

2 

5 

9 

Varietas - 2 

1 

4 

6 

2 

6 

6 

3 

4 

7 

Varietas - 3 

1 

5 

4 

2 

6 

4 


a. Tuliskan model linearnya, lengkap dengan keterangannya! 

b. Hitunglah vector rataan untuk setiap perlakuan. 

c. Hitunglah matriks jumlah kuadrat dan hasil kali silang dari 
perlakuan (B), galat (W), dan Total (T) 

d. Lakukan pengujian pada taraf a = 5% untuk mengetahui apakah 
ketiga varietas memiliki respon yang berbeda. Gunakan uji Wilks’ 
Lambda! 

e. Apa kesimpulan Anda? 
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3. 


Sebuah observasi dengan 3 respon untuk 3 perlakuan. Hasil dari 


vektor observasi 


-xi 

*3. 



6 


' 5 ' 


'8' 

Perlakuan 1 : 

7 


9 


6 


.9. 


.10. 


.9. 



3 


T 


'2' 

Perlakuan 2 : 

3 


6 


3 


.5. 


.4. 


.5. 



'2' 


'5' 


'2' 

Perlakuan 3: 

3 


1 


3 


.5. 


.4. 


.6. 


a. Buatlah tabel MANOVA 

b. Hitunglah nilai Wilks Lambda untuk menguji pengaruh perlakuan 
dengan a=0.01. 

4. Perhatikan observasi dengan respon xi dan X 2 . Terdapat dua faktor 
dengan tanpa perlakuan pada tabel berikut. 



Level 1 

Faktor 2 

Level 2 Level 3 

Level 4 


F 6 1 

r 4 i 

r s i 

r 2 i 

Level 1 

U 

UJ 

il2J 

UJ 

faktor 1 Leve , 2 

cn oo 

[?] 

0 

[?] 


[-3] 

r—4-1 

r 3 1 

r—4-1 

Level 3 

i 2 J 

I- 5 J 

L 3 J 

i—6 J 



Level 1 

Faktor 2 

Level 2 Level 3 

Level 4 



r 14 i 

r 6 i r 8 i 

r 16 i 

faktor 1 

Level 1 

U J 

U b J 

l-J 



rii 

r 5 1 r°i 

r 2 i 


Level 2 

U 

U 2 J U 

W 
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3 

r -21 

r-ui 

r- 6 ] 

Level 3 

I- 2 J_ 

_LzJ_ 

i i J 

_Ld_ 


a. Tuliskanlah model liniernya lengkap dengan keterangan! 

b. Hitunglah vektor rataan untuk setiap perlakuan! 

c. Lakukanlah uji Wilks Lambda untuk mengetahui apakah masing- 
masing taraf pada masing-masing faktor memberikan respon 
yang berbeda! 

5. Seorang kepala sekolah melakukan penelitian untuk mendapatkan 
metode pembelajaran yang terbaik. Terdapat empat metode yang 


diterapkan di beberapa kelompok kelas. Hasil yang didapat untuk 
mata pelajaran Matematika (MAT), Bahasa Inggris (BI) dan IPA 
adalah sebagai berikut: 


METODE 

KELOMPOK 1 

KELOMPOK 2 

KELOMPOK 3 

KELOMPOK 4 

MA 

T 

BI 

IPA 

MA 

T 

BI 

IP 

A 

MA 

T 

BI 

IP 

A 

MA 

T 

BI 

IPA 

Metode 

1 

70 

60 

70 

85 

65 

75 

90 

70 

80 

95 

75 

85 

Metode 

2 

75 

65 

75 

89 

69 

80 

94 

76 

85 

96 

80 

90 

Metode 

3 

89 

85 

81 

91 

73 

82 

99 

81 

90 

100 

85 

97 

Metode 

4 

92 

82 

85 

100 

80 

90 

105 

84 

93 

110 

90 

101 


a. tuliskan model liniear lengkap dengan keterangan 

b. ujilah apakah metode yang dilakukan memberikan espon yang 
berbeda? 

c. Apakah pengelompokan yang dilakukan berdasarkan kelas 
tersebut efektif? 
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6.Analisi$ Profil (Profile Analysis ) 


6.1. Pendahuluan 

Analisis profil berkenaan dengan situasi dimana serangkaian p perlakuaan 
yang dikenakan terhadap dua populasi (kelompok) atau lebih. Dan 
biasanya didalam melakukan percobaan dengan situasi seperti itu, sering 
kali kita ingin mengetahui pengaruh perlakuan yang satu dengan yang 
lainnya untuk setiap populasi (kelompok). Salah satu metode yang dapat 
digunakan untuk menyelesaikan masalah tersebut adalah dengan 
menggunakan analisis profile (profile analysis). 

Menurut Mor/sson (1991) analisis profile merupakan suatu bagian dari 
pengujian hipotesis terhadap nilai tengah dari peubah ganda 
( multivariate ) dengan menggunakan prinsip grafik. Dengan demikian 
untuk mengetahui perkiraan tentang kemiripan profile baik profile antar 
perlakuan maupun antar kelompok yang dinyatakan dengan kesejajaran 
itu, dapat kita lihat dari grafik plot antara nilai rataan tiap-tiap perlakuan 
untuk setiap kelompok (populasi). Tetapi hanya dengan melihat grafik 
saja tidaklah cukup, kita juga perlu untuk mengetahui seberapa besar arti 
kesejajaran (kemiripan) dari populasi itu. Untuk itulah diperlukan 
serangkaian uji-uji yang berkaitan dengan hipotesis itu. 

Untuk melakukan analisis profile ini diperlukan asumsi-asumsi sebagai 
berikut: 
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1. Setiap perlakuan untuk kelompok (populasi) yang berbeda bersifat 
saling bebas satu dengan lainnya. 

2. Seluruh respon dari peubah-peubahnya harus dinyatakan dengan 
satuan yang sama agar dapat dibandingkan dan dijumlahkan . 

3. Nilai galatnya menyebar multinormal dengan rataan 0 dan ragam a. 

Ada tiga pertanyaan atau hipotesis yang akan di uji didalam anlisis profile, 
yaitu : 

1. Apakah profile -profile itu sejajar ? 

atau setara dengan Ho:|ni-|iir 1 =^ 121 -^ 21-1 untuk 1= 2,3,4,...p . 

2. Jika profile itu sejajar, apakah profile-profile itu saling berhimpit?. 

atau setara dengan Ho: 1111=1121 untuk 1= 1,2,3 ...p. 

3. Jika profile-profile itu saling berhimpit apakah profile-profile itu memiliki 
besaran yang sama ? 

Atau setara dengan Ho : jii 1 = 1122 =...=|ii p =|i 2 i=|i 22 =...=|i 2 p. (sejajar 
dengan sumbu X (datar)). 

Hipotesis pertama berkaitan dengan interaksi (pengaruh) antar kelompok 
perlakuan. Jika sejajar, maka interaksi (pengaruh) antar perlakuan 
tersebut tidak ada. Sedangkan hipotesis kedua berkaitan dengan 
hipotesis kesamaan pengaruh setiap perlakuan pada tiap kelompok. Jika 
berhimpit, maka nilai tengah untuk masing-masing perlakuan tiap 
kelompok akan sama. Dan hipotesis ketiga berkaitan dengan kesemua 
perlakuan itu mempunyai nilai tengah yang sama untuk setiap kelompok 
(populasi). 

Ketiga hipotesis diatas tersebut haruslah diuji secara berurutan. Artinya 
bahwa jika hipotesis pertama (mengenai kesejajaran), setelah diuji 
ternyata di tolak, maka uji-uji untuk hipotesis dua (keberhimpitan) dan tiga 
(kehorisontalan) tidak akan berlaku lagi. 
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6.2. Pengujian Hipotesis 


Apabila analisis profile dinotasikan dalam persamaan matriks, maka 
model umumnya adalah sebagai berikut: 


y w 


1...0.0 


yin x 


1...0.0 


y 21 


0...1.0 

An 



. 

A 21 

y 2 n 2 


0...1.0 




. 

Ma 

ya 


0...0.1 


y m. 


0...0.1 



e u 





e \ nl 

Al 2 

Ai p 


e 2l 

A 22 • 

•• M2p 

+ 

^2 n 2 

A/2 • 

Mip 


e il 


Atau dapat juga ditulis 


Y=XB+E, 


dengan X adalah matriks rancangan berdimensi (N x I), B matriks 
parameter berdimensi ( I x p), dan E matriks galat berdimensi ( N x p). 
Sedangkan Y merupakan matriks peubah tak bebas berdimensi ( N x p). 
Dengan p = jumlah peubah tak bebas, 1= jumlah perlakuan (populasi), 
ni= jumlah pengamatan pada perlakuan ke-I dan N= jumlah total 
pengamatan. 


6.2.1. Uji Kesejajaran (Parallel Test ) 

Bentuk umum hipotesisnya : 


Mu~ M 


1 

(N 

1 

1_ 


1 

J: 

1 

_1 

Mn ~ Ai 3 

= 

1 

1 • 

= ...= 

Mn -Mu 

Mi(p-i) ~ Mi P 


Mi(p-i) Mi P 


Mi(p-i) ~ Mip 
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Uji kesejajaran untuk dua populasi yang menyebar normal dapat 
dituliskan sebagai berikut: 

Hoi : Cjii = C|i 2 dimana C merupakan matriks kontras sedemikian 
sehingga membuat persamaan seperti pada bentuk umum hipotesis 
kesejajaran diatas. 




-1 

0 


1 0 

-1 1 


0 0 0 


Untuk contoh bebas dari dua populasi (perlakuan), maka kita dapat 
membuat nilai rataan untuk tiap-tiap peubahnya sehingga akan kita 
dapatkan rataan dari populasi 1 xi dan rataan dari populasi 2 X 2 . 


Dan pengujian nya adalah sebagai berikut 


T 2 = (*! 
dengan 


x 2 yc 


(— + —)CSC 
n \ n 2 


C(x i 


2 _ + n 2 -2){p-\) 


C = 


n \+ n 2 ~P 


p-l,n l +n 2 -p 


(a) 


x 2 ) 


dengan S adalah matriks koragam (Covarian) dari peubah-peubahnya. 

Hipotesis nol ditolak jika nilai dari T 2 > c 2 . Dengan nilai dari c 2 nya 
tergantung dari nilai tabel sebaran F dengan dbl = p-1 dan db2=nl + n2 - 
p pada (a) 
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6.2.2. Uji Keberhimpitan (Coincident Test) 

Bentuk umum dari hipotesisnya adalah : 


Ml 


A21 


Mi 

M 2 

= 

M22 

= ...= 

M 2 

Mi P 


K) 

^5 


_Mp_ 


Atau dengan kata lain, profile akan saling berhimpit apabila total dari nilai 
tataan tiap-tiap populasi 


|ai l+|il2+....+|ilp-|I21+|i22+... + |i2p-. —fj.il + +piip . 

dan untuk dua populasi yang normal maka bentuk hipotesis nolnya 
adalah 


Ho : 1 ’fii = 1 ’n 2 . 

Pengujian hipotesis ini baru dapat dilakukan setelah uji pada kesejajaran 
dapat di terima. Statistik uji untuk pengujian hipotesis keberhimpitan 
dapat ditulis sebagai: 


T 2 = l'(x 1 -x 2 ) 


(— + —)!'51 


l'(x 1 -x 2 ) 


T 2 = 


l'Ul -x 2 ) 

l(- + —)VSl 

vv n i n 2 


Untuk kaidah pengambilan keputusannya adalah kita akan menolak 
Hipotesis nol apabila nilai dari statistik uji T 2 tersebut diatas > t 2 n i+n2-2 
(a/2) (distribusi t tabel dengan db=nl+n2-p pada level (a) dikuadratkan). 
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Atau kita juga akan menolak hipotesis nol apabila T 2 > f P -i,ni+n 2 - P (a) 
(distribusi F tabel dengan dbl =p-l dan db2=nl+n2-p pada level (a)) 


6.2.3. Uji Kesamaan (Level Test) 

Apabila profil-profil tersebut berhimpit (hipotesis nol keberhimpitan 
diterima), maka seluruh observasi tersebut berasal dari populasi normal 
yang sama. Maka langkah selanjutnya adalah apakah seluruh 
peubahnya tersebut memiliki nilai rataan yang sama . 

Ketika kesejajaran dan keberhimpitan dapat diterima, maka vektor rataan 
ji (dari dua populasi normal) dapat diduga dengan menggunakan nl+n2 
observasi (pengamatan) sebagai berikut: 


nl n2 

“ 7=1 7=1 

x = - --- 

n x + n 2 

Jika profile itu sama (se-level), maka jn = ji 2 =...=ji P . 
Bentuk hipotesis nolnya dapat kita tuliskan sebagai: 


Mu 


Mi\ 


Mil 

Mu 

= 

Mil 

= ...= 

Mi2 

_Mi P _ 


_M2p_ 


_Mi P _ 


n i — u-) 

- - - X x H--- 

n x +n 2 n x + n 2 


Atau dapat juga dituliskan sebagai: H03 : C[i =0 . 
Statistik uji yang digunakan adalah : 

F = {n x +n 2 )x'C' 
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Hipotesis nol ditolak jika statistik uji diatas F > dari F P -i, n i+n 2 - P (a) (lebih besar 
dari nilai distribusi F tabel dengan derajat kebebasan dbl = p-1 dan db2= 
nl+n2-p pada taraf (level) pengujian (a)). 


6.2.4. Ilustrasi 

Jurusan Gizi dam makanan di Virginia Polytecnic Institute and State 
University pada tahun 1976 melakukan penelitian mengenai “Vitamin C 
Retention in Reconstituted Frozen Orange Juice“ untuk mengetahui 
bahwa kadar asam askorbat menentukan kestabilan vitamin C. 


Untuk tujuan tersebut, dilakukan penelitian pada dua jenis sari air jeruk 
yaitu merk Richfood dan Sealeda yang masing-masing diulang sebanyak 
empat kali. Dua sari air jeruk tersebut disimpan dalam lemari es selama 
satu minggu. Selama selang waktu tersebut diukur kadar asam 
askorbatnya dalam satuan miligram(mg) per liter pada 3 waktu yang 
berbeda yaitu waktu ke-0, waktu ke-3, dan waktu ke-7. Data yang 
diperoleh dari percobaan tersebut adalah: 


Merk 

WO 

W3 

W7 

Richfood 

52.6 

49.4 

42.7 

Sealed 

56.0 

48.8 

49.2 

Richfood 

54.2 

49.2 

48.8 

Sealed 

48.0 

50.3 

44.0 

Richfood 

49.8 

42.8 

40.4 

Sealed 

49.6 

44.0 

42.0 

Richfood 

46.6 

53.2 

47.6 

Sealed 

48.4 

48.5 

43.2 


62.4.L Pembahasan dengan Metode Grafik 

Menurut Morisson (1991) , pada dasarnya analisis profile merupakan suatu 
bagian dari uji hipotesis terhadap nilai tengah dari peubah ganda 
dengan menggunakan prinsip grafik. Dari data di atas, maka kita memiliki 
2 kelompok yaitu Richfood dan Sealed, serta tiga peubah yaitu W-0, W-3, 
dan W-7. Untuk memulai analisis dengan menggunakan metode grafik ini. 
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PLOT RATAAN TIAP POPULASI 



Peubah(W) - 

—♦— RICHFOOD —•— SEALED 


kita hanya membutuhkan nilai rataan tiap-tiap peubah didalam setiap 
populasi. Kemudian setelah mendapatkan nilainya, dibuatlah grafik plot 
untuk setiap populasi. Didapat rataan tiap-tiap peubah untuk Richfood = 
[58,8 48,65 44,87] dan untuk populasi Sealed = [50,5 47,9 44,6]. 

Kemudian dari nilai nilai ini didapat plot sebagai berikut: 

Dari grafik di atas sudah dapat digambarkan bahwa profil untuk setiap 
kelompok tersebut sejajar dan berhimpit. Seberapa jauh nilai dari 
kesejajaran dan keberhimpitannya bersifat relatif, karena dengan 
menggunakan metode grafik pengujiannya masih bersifat kasar. Namun 
demikian, hasil yang diperoleh dari pendekatan secara grafik seharusnya 
tidak jauh berbeda dengan hasil pengujian melalui uji-uji analisis profile. 


6.14.2. Pembahas dengan Metode Uji-uji Analisis Profil 

Uji akan dilakukan pada taraf nyata 0.05. Diketahui bahwa rataan untuk 
tiap populasi Xr=[50.8, 48.65, 44.87] dan Xs=[50.5, 47.9, 44.6], sehingga 
didapat matriks selisih rataan kedua populasi ter sebut yaitu X=[0.3, 0.75, 
0.27]. Sedangkan nilai dari matriks koragam peubah-peubahnya nya dan 
nilai matrik C yang digunakan berukuran 2x3 yaitu: 


108 

















wO 

w3 

w7 

wO 

10.7629 

3.1471 

4.9579 

w3 

3.1471 

15.4964 

9.3632 

w7 

4.9579 

9.3632 

11.1398 


*-[ 

-1 1 01 
0 -1 lJ 



f 


“ 10.76 

3.14 

4 . 96 “ 



\ 

f 

1 

“-1 1 0 " 




"-1 

1 0 " 




3.14 

15.5 

9.36 




6 

0 -1 1 




0 

-1 1 


V 


4.96 

9.36 

11.14 



J 


sehingga 


"0.3“ 

t 



f 



"0.3" 



“-1 

1 0“ 


“-1 

1 0" 
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0.27 


Selanjutnya pengujian kesejajaran dapat dilakukan menggunakan 
Software SAS IML dengan membuat makro SAS sesuai prossedur 
perhitungannya. Tahapan yang dilakukan dalam pembuatan makro SAS: 

1. Hitung nilai T 2 . 

2. Hitung nilai c 2 . 

Dengan menggunakan data di atas, nilai T 2 = 0.1753. dan nilai c 2 dengan 
F 2 , 2 i (0.05) =3,47 dan n 1=12 n2=12serta p=3 yaitu : 

c2 = (12 + 12-2)(3-l) 347 = (22K2) 347 = 727 
12 + 12-3 21 


Untuk mengambil keputusan, dilakukan perbandiingan antara nilai T 2 dan 
c 2 . Karena nilai T 2 < c 2 , maka dapat disimpulkan bahwa profile antara 
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kelompok (merk) tersebut adalah sejajar. Atau dengan kata lain bahwa 
seiring dengan bertambahnya waktu maka asam askorbat pada kedua 
kelompok tersebut mengalami penambahan dan pengurangan dengan 
proporsi yang sama (tidak ada perbedaan pengaruh perlakuan). 
Kesimpulan ini juga didukung oleh tampilan grafik diatas. 

Selain menggunakan kedua pendekatan di atas, beberapa nilai statistik 
dapat juga digunakan sebagai dasar untuk pengambilan keputusan uji 
kesejajaran. Nilai statistik tersebut antara lain: wilks’lamda, pillai’s trace, 
Hottelling-lawleytrace dan Roy’s greatest root. Keempat nilai statistic 
tersebut dapat diperoleh menggunakan PROC GLM pada Software SAS. 
Nilai ke empat statistik berdasarkan data di atas: 


Statistic 

Value 

F 

Num DF 

Den DF 

Pr > F 

Wilks' Lambda 

0.990898 

0.023 

2 

5 

0.9774 

Pillai's Trace 

0.009102 

0.023 

2 

5 

0.9774 

Hotelling-Lawley Trace 

0.009185 

0.023 

2 

5 

0.9774 

Roy's Greatest Root 

0.009185 

0.023 

2 

5 

0.9774 


Dengan menggunakan a= 0.05, maka dapat disimpulkan profile antara 
kelompok (merk) tersebut adalah sejajar (nilai Pr>F lebih besar dari 0.05). 

Setelah hipotesis mengenai kesejajaran diterima, maka langkah 
selanjutnya adalah uji mengenai keberhimpitan. 

Didefinisikan matriks 1’ =[1 1 1], statistik uji keberhimpitan adalah : 



3.14 

4.96" 

T 

\ 


T 

t 

“0.3" 

15.5 

9.36 

1 



l 


0.75 

9.36 

11.14 

1 

J 


l 


0.27 


Dapat dihitung dengan menggunakan proc IML dalam SAS bahwa nilai T 2 
=0.38. 
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Kaidah pengambilan keputusan dilakukan dengan membandingkan nilai 
T 2 dengan nilai F tabel dengan dbl=l dan db2=22 pada level 0.05 yang 
nilainya sama dengan 4.30. Karena nilai T 2 < F tabel, maka dapat 
disimpulkan bahwa profile kedua kelompok itu saling berhimpit. Hal ini 
menunjukkan bahwa kedua merk sari air jeruk tersebut memiliki kadar 
asam askorbat yang sama setelah disimpan selama seminggu. 

Uji keberhimpitan dapat juga dilihat dari hasil analisis ragam untuk tiap- 
tiap waktu pengamatan : 

Dependent Variable: W-0 


Source 

DF 

Sum of Squares 

Mean Square 

F Value 

Pr > F 

Model 

1 

0.18 

0.18000000 

0.01 

0.9085 

Error 

6 

75.16 

12.52666667 



Corrected Total 

7 

75.34 




Dependent Variable: W-3 






Sum of 

Mean 

F 


Source 


DF Squares 

: Square 

Value 

Pr > F 

Model 


1 1.125 

1.12500000 

0.09 

0.7784 

Error 


6 77.93 

12.98833333 



Corrected Total 


7 79.055 




Dependent Variable: W-7 




Source 

DF 

Sum of Squares 

Mean Square 

F Value 

Pr > F 

Model 

1 

0.15125 

0.15125000 

0.01 

0.917 

Error 

6 

77.8275 

12.97125 



Corrected Total 

7 

77.97875 





Setelah mengetahui bahwa profile kedua merk sari air jeruk (kelompok) 
tersebut sejajar dan berhimpit, maka uji pada analisis profile yang ketiga 
yaitu mengenai kesamaan (rataan kandungan asam karbonat dari waktu 



kewaktu adalah sama) dapat kita lakukan. Kita akan menemukan matriks 
rataan dari waktu kewaktu secara keseluruhan yaitu: 



“ 50.8 ' 


“50.5“ 


“ 50.65 “ 

X = — 

48.65 

12 

H- 

47.9 


48.275 

24 

44.87 

24 

44.6 


44.735 


Statistik ujinya adalah : 
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1 
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~-l 1 
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0 

-1 1 
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Sehingga didapat nilai T 2 = 110.032. 


Kaidah pengambilan keputusannya adalah pembandingan nilai T 2 
dengan nilai tabel sebara F dengan dbl=2 dan db2=21 pada level 0.05. 
dapat diketahui bahwa nilai T 2 > nilai F tabel. Dan dapat dikatakan 
bahwa rataan jumlah kandungan asam askorbat dalam kedua merk sari 
air jeruk tersebut tidak sama (tidak sejajar dengan sumbu X). Hal ini jelas 
terlihat pada grafik diatas. 


Pengambilan keputusan untuk uji kesamaan dapat juga dilihat 
berdasarkan nilai statistik wilks’lamda, pillai’s trace, Hottelling-lowleytroce 
dan Roy’s greatest root yang diperoleh menggunakan PROC GLM pada 
Software S AS. 


Statistic 

Value 

F 

Num DF 

Den DF 

Pr > F 

Wilks' Lambda 

0.12711 

17.1683 

2 

5 

0.0058 

Pillai's Trace 

0.87289 

17.1683 

2 

5 

0.0058 

Hotelling-Lawley Trace 

6.86732 

17.1683 

2 

5 

0.0058 

Roy's Greatest Root 

6.86732 

17.1683 

2 

5 

0.0058 
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Dengan menggunakan a= 0.05, maka dapat disimpulkan bahwa rataan 
jumlah kandungan asam askorbat dalam kedua merk sari air jeruk 
tersebut tidak sama (nilai Pr>F lebih kecil dari 0.05). 


6.3. Aplikasi SAS 


Sebagai ilustrasi dari penggunaan SAS untuk analisis profil telah diuraikan 
pada ilustrasi sebelumnya. Berikut ini adalah perintah yang digunakan 
pada SAS dan outputnya. 


data profil; 

input wo w3 w7 merk$; 

cards ; 


52.6 

49.4 

42.7 

Richfood 

56.0 

48.8 

49.2 

Sealed 

54.2 

49.2 

48.8 

Richfood 

48.0 

50.3 

44.0 

Sealed 

49.8 

42.8 

40.4 

Richfood 

49.6 

44.0 

42.0 

Sealed 

46.6 

53.2 

47.6 

Richfood 

48.4 

48.5 

43.2 

Sealed 


proc glm data=profil; 

class merk; 

model wo w3 w7= merk; 

manova h=merk/printe printh; 

repeated waktu 3 (012); 

run; 


Output dari program di atas sebagai berikut: 


Class 

Analisis Profil 

The GLM Procedure 

Class Level Information 

Levels Values 


merk 

2 Richfood 

Sealed 

Number 

of Observations Read 

8 

Number 

of Observations Used 

8 


113 






The GLM 

Procedure 




Dependent Variable: wo 








Sum of 




Source 

DF 

Squares 

Mean Square 

F 

Value 

Pr > F 

Model 

1 

0.18000000 

0.18000000 


0.01 

0.9085 

Error 

6 

75.16000000 

12.52666667 




Conrected Total 

7 

75.34000000 






R-Square 

Coeff Var 

Root MSE 


wo Mean 



0.002389 

6.987765 

3.539303 


50.65000 


Source 

DF 

Type I SS 

Mean Square 

F 

Value 

Pr > F 

merk 

1 

0.18000000 

0.18000000 


0.01 

0.9085 

Source 

DF 

Type III SS 

Mean Square 

F 

Value 

Pr > F 

merk 

1 

0.18000000 

0.18000000 


0.01 

0.9085 



The GLM 

Procedure 




Dependent Variable: w3 








Sum of 




Source 

DF 

Squares 

Mean Square 

F 

Value 

Pr > F 

Model 

1 

1.12500000 

1.12500000 


0.09 

0.7784 

Error 

6 

77.93000000 

12.98833333 




Corrected Total 

7 

79.05500000 






R-Square 

Coeff Var 

Root MSE 


w3 Mean 



0.014231 

7.465423 

3.603933 


48.27500 


Source 

DF 

Type I SS 

Mean Square 

F 

Value 

Pr > F 

merk 

1 

1.12500000 

1.12500000 


0.09 

0.7784 

Source 

DF 

Type III SS 

Mean Square 

F 

Value 

Pr > F 

merk 

1 

1.12500000 

1.12500000 


0.09 

0.7784 

Dependent Variable: w7 








Sum of 




Source 

DF 

Squares 

Mean Square 

F 

Value 

Pr > F 

Model 

1 

0.15125000 

0.15125000 


0.01 

0.9175 

Error 

6 

77.82750000 

12.97125000 




Corrected Total 

7 

77.97875000 






R-Square 

Coeff Var 

Root MSE 


w7 Mean 



0.001940 

8.050432 

3.601562 


44.73750 
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Type I SS 

Mean Square 

F Value 

Pr > F 

0.15125000 

0.15125000 

0.01 

0.9175 

Type III SS 

Mean Square 

F Value 

Pr > F 

0.15125000 

0.15125000 

0.01 

0.9175 


The GLM Procedure 
Multivariate Analysis of Variance 

E = Error SSCP Matrix 

) w3 v 

-8.84 34.54 

77.93 51.105 

51.105 77.8275 


Partial Correlation Coefficients from the Error SSCP Matrix / Prob > |r| 
DF = 6 wo w3 w7 


wo 

w3 

w7 

1.000000 

-0.115507 

0.451609 


0.8052 

0.3091 

-0.115507 

1.000000 

0.656213 

0.8052 


0.1094 

0.451609 

0.656213 

1.000000 


The GLM Procedure 
Multivariate Analysis of Variance 

H = Type III SSCP Matrix for merk 


0.165 

0.4125 

0.15125 


Characteristic Roots and Vectors of: E Inverse * H, where 
H = Type III SSCP Matrix for merk 
E = Error SSCP Matrix 


Characteristic 
Root Percent 


Characteristic Vector V'EV=1 
) w3 w7 


.03468049 
.00000000 
. 00000000 


0.11814022 

0.08737238 

-0.07154281 


.18137609 

.04939903 

.02602314 


-0.14469731 

0.03940931 

0.14901890 


MANOVA Test Criteria and Exact F Statistics for the Flypothesis of No Overall merk 

Effect 

Fl = Type III SSCP Matrix for merk 
E = Error SSCP Matrix 





S=1 

M=0.5 

N=1 



Statistic 

Value 

F Value 

Num DF 

Den DF 

Pr > F 

Wilks' Lambda 

0.96648193 

0.05 

3 

4 

0.9850 

Pillai's Trace 

0.03351807 

0.05 

3 

4 

0.9850 

Hotelling-Lawley Trace 0.03468049 

0.05 

3 

4 

0.9850 

Roy's Greatest Root 

0.03468049 

0.05 

3 

4 

0.9850 


The GLM Procedure 

Repeated Measunes Analysis of Variance 
Repeated Measures Level Information 


Dependent Variable wo w3 w7 

Level of waktu 012 


MANOVA Test Criteria and Exact F Statistics for the Hypothesis of no waktu Effect 
H = Type III SSCP Matrix for waktu 
E = Error SSCP Matrix 
S=1 M=0 N=1.5 


Statistic Value 
Wilks' Lambda 0.12710807 
Pillai's Trace 0.87289193 
Hotelling-Lawley Trace 6.86732130 
Roy's Greatest Root 6.86732130 


F Value 

Num DF 

Den DF 

Pr > F 

17.17 

2 

5 

0.0058 

17.17 

2 

5 

0.0058 

17.17 

2 

5 

0.0058 

17.17 

2 

5 

0.0058 


MANOVA Test Criteria and Exact F Statistics for the Hypothesis of no waktu*merk 

Effect 

H = Type III SSCP Matrix for waktu*merk 
E = Error SSCP Matrix 


S=1 M=0 N=1.5 


Statistic 


Value 


F Value Num DF Den DF 


Pr > F 


Wilks' Lambda 

0.99089826 

0.02 

Pillai's Trace 

0.00910174 

0.02 

Hotelling-Lawley Trace 0.00918535 

0.02 

Roy's Greatest Root 

0.00918535 

0.02 


5 0.9774 
5 0.9774 
5 0.9774 
5 0.9774 


The GLM Procedure 

Repeated Measures Analysis of Variance 
Tests of Hypotheses for Between Subjects Effects 


Source 

DF 

Type III SS 

merk 

1 

1.1704167 

Error 

6 

128.1758333 


Mean Square F Value Pr > F 
1.1704167 0.05 0.8227 

21.3626389 


The GLM Procedure 

Repeated Measures Analysis of Variance 
Univariate Tests of Hypotheses for Within Subject Effects 

Adj 
Pr > F 

Source DF Type III SS Mean Square F Value Pr>F G-G H-F 
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waktu 

2 

141.6325000 70.8162500 

8.27 0.0055 0.0155 

0.0063 

waktu*merk 

2 

0.2858333 0.1429167 

0.02 0.9835 0.9493 

0.9810 

Error(waktu) 

12 

102.7416667 8.5618056 





Greenhouse-Geisser 

Epsilon 0.6814 




Huynh-Feldt Epsilon 

0.9599 



6.4. Latihan 


1. Data berikut merupakan nilai skala menurut kelas sosial ekonomi. 


Skala 


Kelas sosial ekonomi 

A 

B 

C 

Total 

1 

19 

20 

18 

57 


20 

21 

19 

60 


19 

22 

22 

63 


18 

19 

21 

58 


16 

18 

20 

54 


17 

22 

19 

58 


20 

19 

20 

59 


15 

19 

19 

54 

Total 

144 

160 

158 

462 

2 

12 

14 

12 

38 


15 

15 

17 

47 


15 

17 

15 

47 


13 

14 

14 

41 


14 

16 

13 

43 

Total 

69 

76 

71 

216 

3 

15 

14 

17 

46 


13 

14 

15 

42 

12 

15 

15 

42 

12 

13 

13 

38 
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Total 

52 

56 

60 

168 

4 

8 

9 

10 

27 


10 

10 

12 

32 


11 

10 

10 

31 


11 

7 

12 

30 

Total 

40 

36 

44 

120 

Grand Total 

305 

328 

333 

966 

a. Apakah sejajar 

profil dari 

keempat 

kelas 

sosial ekonomi 


tersebut?(gunakan alpha 5 %) 

b. Apakah antar kelas sosial ekonomi kondisinya sama ? (Gunakan 
alpha 5 %) 


Petunjuk: Untuk pertanyaan pertama, observasi ditransformasi 
perbedaan skala A dengan skala B (Skala A-Skala B), dan Skala B- 
Skala C. Maka Matriks jumlah kuadrat 


T (Total) f 


75.81 

- 54.48 


- 54.48 

85.81 


P (Perlakuan)= 


424.61 

- 20.48 


- 20.48 

24.31 


E (Galat) = 


51.20 

- 34.00 


- 34.00 

61.50 
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7 


7.Analisis Komponen Utama (Principal 
Component Analysis ) 


7.1. Pendahuluan 

Masalah pereduksian dimensi dari segugus data peubah data peubah 
ganda yang besar sering menjadi topik yang menarik untuk dibahas. 
Beberapa masalah yang timbul dalam mereduksi dimensi tersebut 
adalah bagaimana caranya mendapatkan gugus peubah yang lebih 
kecil namun tetap mampu mempertahankan sebagian besar informasi 
yang terkandung pada data asal. Salah satu metode yang baik 
digunakan adalah dengan menggunakan analisis komponen utama. 
Komponen utama mampu mempertahankan sebagian besar informasi 
yang diukur menggunakan sedikit peubah yang menjadi komponen 
utamanya saja. Rao (1964) juga mempertimbangkan ukuran lain untuk 
menilai informasi yang terkandung sehingga proses pencarian 
komponen utama dengan batasan informasi yang optimal menjadi 
beragam. 

Analisis peubah ganda merupakan analisis yang sering kali 
membutuhkan banyak ‘sumberdaya’ lebih, informasi yang ada pada 
peubah-peubah penjelasnya (x) seringkali tumpah tindih oleh karena itu 
kita membutuhkan analisis yang dapat mengatasi masalah ini. Salah 
satu analisis yang dapat diterapkan untuk mengatasinya adalah analisis 
komponen utama. 
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7.2. Komponen Utama 


Komponen Utama merupakan kombinasi linear dari peubah yang 
diamati, informasi yang terkandung pada komponen utama merupakan 
gabungan dari semua peubah dengan bobot tertentu. Kombinasi linear 
yang dipilih merupakan kombinasi linear dengan ragam paling besar 
yang memuat informasi paling banyak . Antar Komponen Utama bersifat 
ortogonal, tidak berkorelasi dan informasinya tidak tumpang tindih 
Hasil dari prosedur ini nantinya digunakan pada analisis lebih lanjut, 
seperti analisis pengelompokan dan regresi Komponen Utama. Misalkan 
kita xi , ... , x p merupakan p peubah yang menjadi perhatian kita, 
memiliki sebaran peubah ganda dengan vektor rataan n dan matriks 
peragam L. Komponen Utama seperti telah dijelaskan di atas 
merupakan kombinasi linier dari p peubah asal, atau dapat ditulis: 

Y = AX 


dimana: 



-Yi 


' a il 

.. a lp - 



Y = 


, A = 



, x = 



■ Y P. 


.dpi 

.. a pp 


Xp. 


Sehingga komponen utama pertama dapat di tulis sebagai: 

Yi = an Xi + ai 2 X2 +.... + ai P X p 
Yi = a i’ X 

Yang memiliki ragam sebesar: Sy ± = var(a[X ) = a[S a ± 

Pemilihan vektor koefisien Komponen Utama I adalah sedemikian rupa 
sehingga ragam Syi 2 terbesar di antara vektor koefisien yang lain. Untuk 
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mendapatkan hal tersebut dapat dilakukan melalui persamaan 
Lagrange dengan kendala ai’ai=1. 

Maksimumkan: Var(Yi) = ai ’x = ai ’Sai 

dengan kendala : ai’ai = 1 


Persamaan Lagrange : 

f = ( ai’S ai) - h ( ai’ ai - 1 ) 

untuk mencari titik kritis dari persamaan langrange tersebut dapat 
dilakukan dengan cara mencari turunan pertama sebagai berikut: 

df/dai = 2 Sai -2 A,iai = 0 

Sai = X\Q] (ini merupakan persamaan ciri dari matriks S) 

Jika kedua ruas dikalikan dengan a T maka ruas kiri merupakan ragam 
dari Yl, 


ai’Sai = ai’^iai = h = Var(Yi) 

Dengan demikian agar Var(Yi) maksimum maka haruslah fa merupakan 
akar ciri terbesar dari matriks peragam S dan ai merupakan vektor ciri 
yang berpadanan dengan fa. 

Selanjutnya untuk Komponen Utama kedua dapat ditulis sebagai: 

Y2 = 021 Xl + 022 X2 + .... + a2p Xp 

Y 2 = 02 X 

Yang memiliki ragam sebesar: Sy 2 = var(a 2 X) = a 2 S a 2 
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Pemilihan vektor koefisien 02 adalah sedemikian rupa sehingga ragam 
S 2 y2 maksimum dengan kendala 0202 = 1 dan Cov(Yi,Y 2 )=di’Sd 2 = 0 atau 
ai’a 2 = 0. Untuk mendapatkan hal tersebut, prosedur yang digunakan 
mirip seperti pemilihan vektor koefisien untuk Komponen Utama I, yaitu 
dengan persamaan Lagrange. 

Maksimumkan: Var(Y 2 ) = d 2 ’x = d 2 ’Sci 2 

dengan kendala : d 2 d 2 = 1 dan di’d 2 = 0 

Persamaan Lagrange : 

f = ( d2’S d2 ) - %2 [Q2 d2 - 1 ) - a (dl ’ d2 - 0) 

= ( d2’S d2 ] - A,2 (d2* d2 - 1 ) - a dl ’ d2 
Turunan pertama terhadap d 2 diperoleh sebagai berikut: 

^ = 2Sa 2 ~ 2A 2 a 2 - aa ± = 0 

Jika persamaan tersebut dikalikan dengan di’ didapatkan : 

2a’ 1 Sa 2 2X 2 cl’^ cl 2 cccl^cl^ — 0 

Karena di’di = 1 dan di’d 2 = 0 serta di’Sd 2 = 0 maka haruslah a=0. 
Dengan demikian turunan pertama persamaan langrange dapat ditulis 
menjadi: 


2Sa 2 — 2A 2 a 2 — 0 = 2Sa 2 — 2X 2 a 2 = Sa 2 - X 2 a 2 = 0 


Sa 2 — X 2 a 2 
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Ini juga merupakan persamaan ciri dari matriks S. Jika kedua ruas 
dikalikan dengan 02 ' maka sisi kiri merupakan ragam dari Y 2 : 

d2’Sci2 = d2’X2Ci2= fa = Var(Y2) 

Agar var(Y 2 ) maksimum maka haruslah fai merupakan akar ciri terbesar 
dari S. Karena akar cirri terbesar pertama merupakan ragam dari 
komponen utama I maka fa dipilih akar ciri terbesar kedua dari matriks S. 
Demikian juga dengan vector d 2 merupakan vektor ciri yang 
berpadanan dengan akar ciri terbesar kedua fa. 

Selanjutnya untuk Komponen Utama ke-i ; i= 3, 4. p didapatkan dari 
kombinasi linier p peubah asal yang memaksimumkan var(di’ X) dengan 
kendala di’di = 1 dan cov ( di’ X,dk’X ) = 0 untuk k < i. 

Seperti telah dijelaskan di atas bahwa : 

Var(y ± ) = aiSci! = A ± 

Var(Y 2 ) = a' 2 Sa 2 = X 2 

Dimana fa dan fa merupakan akar cirri terbesar pertama dan kedua 
dari matriks S. Dengan cara yang sama seperti penurunan pada 
komponen utama I dan komponen utama II akan diperoleh hasil secara 
umum sebagai berikut: 

Var(Xi) = a[ScLi = A t untuk i=3, 4, 5, p 

Dimana fa, merupakan akar ciri terbesar ke-i dari matriks S dan vector ai 
merupakan vector ciri yang berpadanan dengan fa. 
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Selanjutnya akan dijelaskan besarnya kontribusi keragaman masing- 
masing komponen utama dalam menjelaskan keragaman data asal. 
Untuk menjelaskan hal ini kita harus melihat kembali salah satu teorema 
dalam aljabar matriks yaitu bahwa teras suatu matriks akan sama 
dengan jumlah dari akar ciri-akar ciri matriks tersebut. Sehingga dalam 
kasus ini dapat dituliskan sebagai berikut: 

teras^S) = £f =1 A t 

Sn + s 2 2 H-k s pp = A ± + A 2 -\ -1 - Ap 

var(X 1 ) + var(X 2 ) “i-k var(X p ) = var(Y 1 ) + var(Y 2 ) -I-1- var(Y p ) 

Berdasarkan hubungan ini maka besarnya kontribusi keragaman relative 
yang mampu dijelaskan oleh komponen utama ke-I adalah sebesar: 

var(Yi ) _ Xi _ 

total keragaman dari peubah asal s 11 +s 22 +” , +Spp A 1 +A 2 +---+Ap 

Atau dapat juga dinyatakan dalam besaran persen sebagai berikut: 

x 100% 

Sedangkan besarnya keragaman kumulatif untuk q buah komponen 
utama dapat dituliskan sebagai berikut: 

Z?-iA,- 

ir-y x 100% 

Lj = i Aj 

Apabila kita menghadapi masalah perbedaan skala pengukuran, maka 
peubah dibakukan menjadi: 
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7.3. Penentuan penggunaan matriks korelasi dan 
Ragam peragam 

Secara umum cukup sulit untuk menentukan kapan menggunakan 
matriks korelasi atau matriks ragam peragam untuk memperoleh 
komponen utama. Kesulitan terjadi karena tidak ada hubungan yang 
jelas antara akar ciri dan vektor ciri matriks ragam peragam dengan 
matriks korelasi, dan komponen utama yang dihasilkan oleh keduanya 
dapat sangat berbeda. Demikian juga dengan berapa banyak 
komponen utama yang digunakan. 

Penggunaan matriks korelasi memang cukup efektif kecuali pada dua 
hal. 

Pertama, secara teori pengujian statistik terhadap akar ciri dan vektor ciri 
matriks korelasi jauh lebih rumit. 

Kedua, dengan menggunakan matriks korelasi kita memaksakan setiap 
peubah memiliki ragam yang sama sehingga tujuan mendapatkan 
peubah yang kontribusinya paling besar tidak tercapai. 

7.4. Penentuan Banyaknya Komponen Utama 

Terdapat tiga metode yang umum digunakan untuk menentukan 
banyaknya komponen utama, yaitu: 

❖ Metode 1 

> didasarkan pada kumulatif proporsi keragaman total yang 
mampu dijelaskan. 

> Metode ini merupakan metode yang paling banyak digunakan, 
dan dapat diterapkan pada penggunaan matriks korelasi 
maupun matriks ragam peragam. 

> Minimum persentase kergaman yang mampu dijelaskan 
ditentukan terlebih dahulu, dan selanjutnya banyaknya 
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komponen yang paling kecil hingga batas itu terpenuhi 
dijadikan sebagai banyaknya komponen utama yang 
digunakan. 

> Tidak ada patokan baku berapa batas minimum tersebut, 
sebagian bukau menyebutkan 70%, 80%, bahkan ada yang 
90%. 

Metode 2 

> hanya dapat diterapkan pada penggunaan matriks korelasi. 
Ketika menggunakan matriks ini, peubah asal ditransformasi 
menjadi peubah yang memiliki ragam sama yaitu satu. 

> Pemilihan komponen utama didasarkan pada ragam 
komponen utama, yang tidak lain adalah akar ciri. Metode ini 
disarankan oleh Kaiser (1960) yang berargumen bahwa jika 
peubah asal saling bebas maka komponen utama tidak lain 
adalah peubah asal, dan setiap komponen utama akan 
memiliki ragam satu. 

> Dengan cara ini, komponen yang berpadanan dengan akar ciri 
kurang dari satu tidak digunakan. Jollife (1972) setelah 
melakukan studi mengatakan bahwa cut off yang lebih baik 
adalah 0.7. 

Metode 3 

> penggunaan grafik yang disebut plot scree. 

> Cara ini dapat digunakan ketika titik awalnya matriks korelasi 
maupun ragam peragam. 

> Plot scree merupakan plot antara akar ciri 7k dengan k. 

> Dengan menggunakan metode ini, banyaknya komponen 
utama yang dipilih, yaitu k, adalah jika pada titik k tersebut 
plotnya curam ke kiri tapi tidak curam di kanan. Ide yang ada 
di belakang metode ini adalah bahwa banyaknya komponen 
utama yang dipilih sedemikian rupa sehingga selisih antara akar 
ciri yang berurutan sudah tidak besar lagi. Interpretasi terhadap 
plot ini sangat subjektif. 
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7.5. Manfaat lain dari komponen utama 


Dalam beberapa kasus terapan, analisis komponen utama 
dimanfaatkan untuk berbagai keperluan analisis seperti eksplorasi posisi 
objek dan penangan masalah kolinear antar peubah. Eksplorasi posisi 
objek diperlukan sebagai alat bantu dalam analisis gerombol. Eksplorasi 
ini dapat dilakukan dengan membuat plot skor komponen utama 
pertama dengan kedua. Dari plot ini diharapkan dapat terlihat 
banyaknya kumpulan objek yang terbentuk, yang pada nantinya dapat 
digunakan sebagai nilai awal dalam penentuan jumlah gerombol yang 
akan dibangun. 

Sedangkan dalam kasus kolinear antar peubah, yang merupakan salah 
satu masalah yang sering dihadapi dalam analisis regresi, komponen 
utama dapat merupakan salah satu solusi dalam mengatasi masalah 
kolinear. Penerapan ini relevan dengan sifat dari komponen utama 
yang dibangun yaitu antar komponen utama bersifat saling orthogonal 
atau saling bebas. Dengan memanfaatkan komponen utama ini 
masalah kolinear dalam analisis regresi dapat diatasi. Sifat ini juga 
diperlukan dalam penerapan jarak Euclid, dimana konsep jarak ini juga 
memerlukan kebebasan antar peubah. 

7.6. Penerapan Analisis Komponen Utama dalam 
Analisis Regresi 

Berikut ini disajikan ilustrasi penggunaan Analisis Komponen Utama 
dalam mengatasi masalah multikolinieritas dalam analisis regresi 
berganda. Ilustrasi ini diambil dari skripsi Khristiningrum (1997). 
Tahap-tahap yang dilakukan dalam analisis regresi Komponen Utama 
adalah : 

1. Peubah bebas asal Xj dibakukan dan diskalakan. 



2. Menghitung nilai akar ciri ( ), vektor ciri (yj) dan skor komponen 

utama ( Wj). 

3. Meregresikan peubah respon ( Y ) dengan skor komponen utama 
(Wj) yang terpilih. 


127 


Y = 80 + 81 Wi + 62 W 2 + ... + 8 P W P 

4. Mentransformasi persamaan regresi dengan peubah bebas Wj ke 
peubah bebas Zj. 

Y = (3o + (3i Zi + P 2 Z 2 + ... + (3r Zr 

dengan 
(30 = 50 

(3j = yjl 51 + yj2 52 + ... + yjp 5p ; j = 1,2, ..., r 

5. Mentransformasi persamaan regresi dengan peubah bebas Zj ke 
peubah bebas Xj. 

Y = ao + ai Xi + a 2 X 2 + ... + ar Xr 


Ragam koefisien regresi peubah bebas X adalah : 

2 

*2 



i =1 


sedangkan 


= Y 2 Z 




i=l 


A,- 


s 2 adalah ragam galat dari persamaan pada point (3). 

Pengujian keberartian koefisien regresi, dilakukan dengan 
menggunakan uji t-student dengan statistik uji: 

a: 


t &y~ ■ 


7.7. Aplikasi SAS 

Prosedur PRINCOMP merupakan prosedur yang biasa mengerjakan 
analisis komponen utama. Bentuk umum dari perintah PROC PRINCOMP 
adalah : 
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PROC PRINCOMP <options>; 
VAR variables; 


RUN; 

Berikut ini ilustrasi penggunaan SAS untuk analisis komponen utama. 

Kejahatan merupakan suatu hal yang tidak dapat diabaikan dalam 

pengelolaan sebuah wilayah. Dari setiap negara bagian di Amerika 

Serikat, dicatat besarnya beberapa macam kejahatan selama satu 

tahun dalam bentuk indeks kejahatan per 100.000 penduduk. Dari data 

ini ingin diketahui pola dari data kejahatan. Kejahatan-kejahatan yang 

dicatat adalah : 

Murder (Pembunhuan) 

Rape 

Robbery (perampokan) 

Assault 

Burglary 

Larceny 

Auto_Theft (Pencurian Kendaraan Bermotor) 

Pertama adalah kita harus memasukkan data, secara in-stream bisa 


dituliskan sebagai berikut: 


Data Crime; 

title 'Crime 

Rates per 100, 

000 Population 

by State'; 

input State $1-15 Murder Rape Robbery Assault 
Burglary Larceny Auto Theft; 


datalines; 

Alabama 

14.2 

25.2 96.8 

278.3 

1135.5 

1881.9 

280.7 

Alaska 

10.8 

51.6 96.8 

284.0 

1331.7 

3369.8 

753.3 

Arizona 

9.5 

34.2 138.2 

312.3 

2346.1 

4467.4 

439.5 

Arkansas 

8.8 

27.6 83.2 

203.4 

972.6 

1862.1 

183.4 

California 

11.5 

49.4 287.0 

358.0 

2139.4 

3499.8 

663.5 

Colorado 

6.3 

42.0 170.7 

292.9 

1935.2 

3903.2 

477.1 


catatan : Dalam analisis yang sesungguhnya terhadap sebuah data, 
perlu dilakukan eksplorasi secara lengkap, termasuk pembuatan plot 
dan grafik, analisis korelasi dan statistika deskriptif. Hanya eksplorasi 
singkat saja yang ditunjukkan dalam model ini. Sebagai bagian dari 
kegiatan eksplorasi, kita akan lihat korelasi antara peubah yang terlibat. 
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proc corr data = crime nosimple noprob; 
var murder--auto_theft; 

title 'Korelasi antar peubah kejahatan'; 
run; 


Keluaran dari perintah di atas adalah 


Korelasi antar peubah kejahatan 
The CORR Procedure 

7 Variables: Murder Rape Robbery Assault Burglary Larceny 

Auto_Theft 

Pearson Correlation Coefficients, N = 50 

Auto 



Murder 

Rape 

Robbery 

Assault 

Burglary 

Larceny 

Theft 

Murder 

1.00000 

0.60122 

0.48371 

0.64855 

0.38582 

0.10192 

0.06881 

Rape 

0.60122 

1.00000 

0.59188 

0.74026 

0.71213 

0.61399 

0.34890 

Robbery 

0.48371 

0.59188 

1.00000 

0.55708 

0.63724 

0.44674 

0.59068 

Assault 

0.64855 

0.74026 

0.55708 

1.00000 

0.62291 

0.40436 

0.27584 

Burglary 

0.38582 

0.71213 

0.63724 

0.62291 

1.00000 

0.79212 

0.55795 

Larceny 

0.10192 

0.61399 

0.44674 

0.40436 

0.79212 

1.00000 

0.44418 

Auto Theft 

0.06881 

0.34890 

0.59068 

0.27584 

0.55795 

0.44418 

1.00000 


Jika kita amati secara seksama tabel korelasi di atas, kita lihat bahwa 
beberapa peubah saling berkorelasi. Misalnya saja burglary berkorelasi 
dengan larceny, dengan koefisien korelasi sebesar 0.79212. 


Pada contoh di atas, untuk mengeluarkan semua komponen utama 

yaitu sebanyak peubah yang terlibat, perintah yang diberikan adalah 

sebagai berikut: 

proc princomp data=crime; 
var murder--auto_theft; 

title 'Komponen Utama untuk Data Kejahatan'; 
run; 

Output yang dihasilkan terdiri atas beberapa bagian yang pelu untuk 

diketahui. Pertama, PROC PRINCOMP membuat daftar banyaknya 

peubah dan objek yang diamati pada gugus data, (juga ditampilkan 

statistik deskriptif dan korelasi antar peubah, tapi tidak ditampilkan di sini. 

Penggalan dari keluaran PROC PRINCOMP tersebut adalah : 

Komponen Utama untuk Data Kejahatan 
The PRINCOMP Procedure 
Observations 50 

Variables 7 
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Selanjutnya, PROC PRINCOMP menampilkan akar ciri dan vector ciri dari 
matriks korelasi. Ingat bahwa akar ciri diinterpretasikan sebagai ragam 
dari kombinsai-kombinasi linear atau komponen, dan vektor ciri sebagai 
bobot yang digunakan untuk menyusun skor komponen utama dari 
data yang terpusat, yaitu nilai asli dikurangi rataan peubahnya. 
Penggalan dari keluaran PROC PRINCOMP mengenai hal ini adalah : 

Eigenvalues of the Correlation Matrix 



Eigenvalue 

Difference 

Proportion 

Cumulative 

1 

4.11495951 

2.87623768 

0.5879 

0.5879 

2 

1.23872183 

0.51290521 

0.1770 

0.7648 

3 

0.72581663 

0.40938458 

0.1037 

0.8685 

4 

0.31643205 

0.05845759 

0.0452 

0.9137 

5 

0.25797446 

0.03593499 

0.0369 

0.9506 

6 

0.22203947 

0.09798342 

0.0317 

0.9823 

7 

0.12405606 


0.0177 

1.0000 


Komponen utama pertama, mengandung hampir 60 persen keragaman 
data asal, dan tiga komponen pertama secara bersama mampu 
menjelaskan 87 persen keragaman data. Masing-masing komponen 
sisanya hanya memiliki kontribusi keragaman kurang dari lima persen. 
Hal ini menyarankan bahwa kita bisa membuang komponen-komponen 
akhir, hanya mengambil tiga komponen utama pertama, tanpa 
kehilangan banyak informasi. 


Vektor-vektor ciri bisa diinterpretasikan sebagai koefisien yang menyusun 
skor komponen dari data terpusat. Kadangkala, kita membakukan 
vector ciri sehingga panjang vektornya sama dengan akar dari akar ciri 
yang bersesuaian. Namun ini bukan keluaran default dari PROC 
PRINCOMP. Selanjutnya kita bahas hanya menggunakan tiga 
komponen utama pertama, karena komponen sisanya hanya 
menerangkan sebagian kecil informasi. Penggalan selanjutnya dari 
keluaran PROC PRINCOMP adalah sebagai berikut: 
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The PRINCOMP Procedure 


Eigenvectors 



Prinl 

Prin2 

Prin3 

Murder 

0.300279 

-.629174 

0.178245 

Rape 

0.431759 

-.169435 

-.244198 

Robbery 

0.396875 

0.042247 

0.495861 

Assault 

0.396652 

-.343528 

-.069510 

Burglary 

0.440157 

0.203341 

-.209895 

Larceny 

0.357360 

0.402319 

-.539231 

Auto Theft 

0.295177 

0.502421 

0.568384 


Jika kita mengamati besarnya koefisien dari KU 1 terlihat bahwa setiap 
koefisien memiliki nilai positif dan hampir sama besar. Kondisi ini 
merupakan hal yang umum terjadi dalam analisis komponen utama 
karena KU 1 umumnya merupakan rata-rata dari semua peubah. 
Koefisien ini tidak bisa diartikan sebagai korelasi antara komponen 
dengan peubah asli, kalau ingin diartikan seperti itu harus dilakukan 
penskalaan, dengan membuat panjang vector sama dengan akar dari 
akar ciri yang berpadanan. 


Sementara itu, KU 2 memiliki nilai koefisien yang negatif di beberapa 
peubah dan positif pada peubah lain. Komponen ini merupakan 
kontras antara kejahatan pencurian dengan tindak kekerasan. 
Sedangkan KU 3 merupakan kontras antara pencurian tanpa dan 
dengan kekerasan. 


Seringkali interpretasi komponen merupakan hal yang sulit dan tidak 
mungkin. Dalam kasus ini kita gunakan analisis komponen utama 
sebagai upaya matematis untuk menyederhanakan banyaknya 
peubah. Jika kita ingin menginterpretasikan komponen sebagai 
peubah laten apa yang berada di belakang peubah yang diamati, 
akan lebih tepat jika digunakan analisis faktor (factor analysis). 
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Penggunaan AKU untuk Matriks Korelasi 


Kadang kala kita tidak lagi memiliki matrik data yang berukuran nxp, 
namun kita memiliki matirks korelasi antar peubah asal. PROC 
PRINCOMP bisa melakukan analisis komponen utama dengan masukan 
berupa matriks korelasi dengan cara sesederhana kalau kita gunakan 
matriks data, seperti contoh sebelumnya. 


Misalkan dari data yang sama dengan sebelumnya, kita buat terlebih 

dahulu matriks korelasi. Perintah yang diberikan adalah : 

proc corr data = crime noprint out=cri_corr; 
var murder--auto_theft; 

title 'Korelasi antar peubah kejahatan'; 

run; 


Perintah di atas menghasilkan sebuah gugus data baru yang bernama 
cri_corr. Untuk melihat isi dari gugus data ini, kita bisa mencetak 


menggunakan perintah : 

proc print data = cri_corr; 

title 'Gugus data hasil PROC CORR'; 
run; 


Hasilnya adalah sebagai berikut: 


Gugus data hasil PROC CORR 2 


Auto 


Obs 

TYPE 

NAME Murder Rape 

Robbery Assault 

Burglary Larceny Theft 

1 

MEAN 

7.4440 25.7340 

124.092 

211.300 

1291.90 

2671.29 

377.526 

2 

STD 

3.8668 10.7596 

88.349 

100.253 

432.46 

725.91 

193.394 

3 

N 

50.0000 50.0000 

50.000 

50.000 

50.00 

50.00 

50.000 

4 

CORR 

Murder 1.0000 0.6012 

0.484 

0.649 

0.39 

0.10 

0.069 

5 

CORR 

Rape 0.6012 1.0000 

0.592 

0.740 

0.71 

0.61 

0.349 

6 

CORR 

RobberyO.4837 0.5919 

1.000 

0.557 

0.64 

0.45 

0.591 

7 

CORR 

Assa 0.6486 0.7403 

0.557 

1.000 

0.62 

0.40 

0.276 

8 

CORR 

BurglaryO.3858 0.7121 

0.637 

0.623 

1.00 

0.79 

0.558 

9 

CORR 

Larceny 0.1019 0.6140 

0.447 

0.404 

0.79 

1.00 

0.444 

10 

CORR 

Auto_TheftO.0688 0.3489 0.591 

0.276 

0.56 

0.44 



1.00 


Selanjutnya kita lakukan analisis komponen utama, menggunakan PROC 
PRINCOMP. 
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proc princomp data=cri_corr (type = corr); 

title 'Hasil AKU dengan input matriks korelasi'; 
run; 


Hasil AKU dengan input matriks korelasi 
The PRINCOMP Procedure 
Observations 50 

Variables 7 

Eigenvalues of the Correlation Matrix 



Eigenvalue 

Difference 

Proportion Cumulative 

1 

4.11495951 

2.87623768 

0.5879 

0.5879 

2 

1.23872183 

0.51290521 

0.1770 

0.7648 

3 

0.72581663 

0.40938458 

0.1037 

0.8685 

4 

0.31643205 

0.05845759 

0.0452 

0.9137 

5 

0.25797446 

0.03593499 

0.0369 

0.9506 

6 

0.22203947 

0.09798342 

0.0317 

0.9823 

7 

0.12405606 


0.0177 

1.0000 



Eigenvectors 



Prinl 

Prin2 Prin3 

Prin4 Prin5 

Prin6 

Murder 0.300279 

-.629174 0.178245 

-.232114 0.538123 

0.259117 ( 

Rape 

0.431759 

-.169435 -.244198 

0.062216 0.188471 

-.773271 ■ 

Robbery 0.396875 

0.042247 0.495861 

-.557989 -.519977 

-.114385 ■ 

Assault 0.396652 

-.343528 -.069510 

0.629804 -.506651 

0.172363 ( 

Burglar 0.440157 

0.203341 -.209895 

-.057555 0.101033 

0.535987 ■ 

Larceny 0.357360 

0.402319 -.539231 

-.234890 0.030099 

0.039406 ( 

Auto 

Theft0.295177 

1 0.5024210.568384 

0.419238 0.369753 

-.057298 ( 


Prin7 
0.267593 
296485 
003903 
0.191745 
648117 
0.601690 
0.147046 


7.8. Latihan 

1. Diberikan matriks kovarian sebagai berikut: 

Z-B 3 

a. Buatlah komponen utama Yi dan Y 2 berdasarkan matriks 
kovarian tersebut 

b. Hitung proporsi keragaman total yang dapat dijelaskan oleh 
komponen utamal! 

2. Konversi matriks kovarian pada soal no 1 ke dalam matriks korelasi 
p. Berdasarkan matriks korelasi. 


a. Hitung nilai komponen utamanya 

b. Hitung proporsi keragaman total yang dapat dijelaskan oleh 
komponen utama 1! 
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c. Bandingkan hasil yang diperoleh dengan hasil pada no 1, 
apakah hasilnya sama? Bagaimana seharusnya? 

3. Diberikan matriks kovarian sebagai berikut: 

'4 0 0' 

0 8 0 
.0 0 4. 

a. Tentukan komponen utama Y1 , Y2 dan Y3. 

b. Apa yang dapat Anda ceritakan mengenai komponen utama 
yang dihasilkan! 

c. Berdasarkan matriks kovarian diatas, tunjukkanlah bahwa ragam 
dari komponen utama pertama sama dengan akar ciri terbesar 
dari matriks kovariannya 

4. Seorang peneliti melaporkan matriks korelasi dari hasil pengukuran 
efikasi diameter, susut bobot, respirasi O 2 dan total padatan terlarut 


1 

0.81 

-0.82 

-0.8- 

0.81 

1 

-0.91 

-0.8 

-0.82 

-0.91 

1 

0.86 

-0.8 

-0.8 

0.86 

1 J 


a. Hitunglah komponen utama pertama dari matrik korelasi 
tersebut 

b. Hitung proporsi keragaman total yang dapat dijelaskan oleh 
komponenutama 1 

5. Seorang peneliti tanaman melakukan penelitian mengenai 

karakteristik kuantitatif generatif dan vegetatif bunga dari suatu 

tanaman. Peubah yang diamati adalah: 

bobot kering biji ( XI) -jumlah petal (X2) 
jumlah sepal (X3) -jumlah cabang produktif (X4) 

waktu mekar (X5) - dimater batang (X6) 

dimaeter cabang (X7) - jumlah buku pembibitan (X8) 

Data tersebut diolah dengan menggunakan analisis komponen utama: 

Principal Component Analysis: x1; x2; x3; x4; x5; x6; x7; x8 

Eigenanalysis of the Correlation Matrix 



135 




Eigenvalue 

6, 6220 

0 

, 5726 

0 

, 3409 

0,3213 

0 

, 0715 

0 

, 0574 

0 

, 0145 

0 , 

0000 

Proportion 

0,828 

0 

, 072 

0 

, 043 

0,040 

0 

, 009 

0 

, 007 

0 

, 002 

0 

, 000 

Cumulative 

0,828 

0 

, 899 

0 

, 942 

0, 982 

0 

, 991 

0 

, 998 

1 

,000 

1 

, 000 

Variable 

PCI 


PC2 


PC3 

PC4 


PC5 


PC6 


PC7 


PC8 

x 1 0 

,366 

-o. 

324 

-o. 

216 

-0,104 

-o. 

154 

-o. 

736 

-o. 

373 

0 , 

000 

x2 0 

,307 

-o. 

783 

0 , 

147 

0,007 

-o. 

244 

0 , 

443 

0 , 

122 

-o. 

000 

x3 0 

,338 

0 , 

327 

-o. 

685 

-0,051 

-o. 

449 

0 , 

324 

0 , 

003 

-o. 

000 

x4 0 

,373 

-o. 

061 

-o. 

271 

0,028 

0 , 

817 

0 , 

239 

-o. 

240 

0 , 

000 

x5 0 

,383 

0 , 

069 

-o. 

006 

-0,143 

0 , 

165 

-o. 

283 

0 , 

849 

0 , 

000 

x6 0 

, 359 

0 , 

206 

0 , 

285 

0,545 

-o. 

089 

-o. 

017 

-o. 

073 

-o. 

661 

x7 0 

, 329 

0 , 

273 

0 , 

454 

-0,723 

-o. 

064 

0 , 

142 

-o. 

230 

-0, 

107 

o 

00 

X 

, 367 

0 , 

222 

0 , 

319 

0,381 

-o. 

088 

0 , 

005 

-0, 

098 

0 , 

743 


Pertanyaanya : 

a. Menurut Anda, Apa alasan peneliti tersebut menggunakan 
analisis komponen utama? 

b. Pada kasus dan kondisi data yang bagaimanakah analisis 
komponen utama dilakukan? 

c. Berdasarkan hasil diatas, ada berapa komponen utama yang 
sebaiknya dipilih? Berikan alasan Anda! 
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8. Analisis Faktor (Factor Analysis ) 

8.1. Pendahuluan 

Analisis faktor adalah salah satu analisis yang banyak digunakan pada 
statistik peubah ganda, diperkenalkan pertama kali oleh Spearman 
(1904), dan dikembangkan oleh Thurstone (1947), Thomson (1951), 
Lawley (1940, 1941) dan lainnya. Pada awalnya analisis ini tergolong 
sulit dan kontroversial, namun dalam perkembangaannya dirasakan 
menjadi alat yang sangat berguna. Terutama setelah perkembangan 
komputer dan paket-paket piranti lunak statistik., serta pada tahun 
1970-an banyak terbit buku dan publikasi lain yang mambahas 
penerapannya di berbagai bidang seprti biologi, kimia, ekologi, 
ekonomi, pendidikan, ilmu politik, psikologi, dan sosiologi. Penerapan 
tentang analisis ini secara detail di berbagai bidang dapat dirujuk 
pada berbagai terbitan. 

Pada analisis faktor, perhatian utama adalah menemukan hubungan 
internal antar segugus peubah acak. Spearman (1904) ketika berkerja 
dengan skor-skor yang diperoleh dari pengujian pendidikan, mencatat 
pola sistematik pada matriks korelasi antar skor. Ilustrasinya adalah 
sebagai berikut, misalkan matriks korelasi p dihasilkan dari enam buah 
skor/nilai hasil pengujian : Sejarah (C), Bahasa Perancis (F), Bahasa 
Inggris (E), Matematika (M), Ketrampilan Tangan (D), dan Music (Mu), 
yang diukur pada 33 siswa sekolah persiapan. Matriks korelasi yang 
dihasilkan adalah 
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C 1.00 0.83 0.78 0.70 0.66 0.63 

F 0.83 1.00 0.67 0.67 0.65 0.57 

P= E 0.78 0.67 1.00 0.64 0.54 0.51 

M 0.70 0.67 0.64 1.00 0.45 0.51 

D 0.66 0.65 0.54 0.45 1.00 0.40 

Mu[0.63 0.57 0.51 0.51 0.40 1.00 

Peubah-peubah di atas disusun sedemikian rupa sehingga didapatkan 
pola korelasi yang menurun pada matriks tersebut. Yang menarik pada 
matriks ini tentus saja bukanlah unsur diagonalnya. Jika diperhatikan 
sesecara seksama, terlihat bahwa setiap dua baris pada matriks itu 
hampir proporsional. Misalnya saja perhatikan baris untuk C dan M, 
rasionya adalah 

0.83 0.78 0.66 0.63 

0.67 ~ 0.64 ~ 0.45 ~ 0.51 ~ 

Spearman berpendapat bahwa pola pada matriks korelasi itu dapat 
dijelaskan menggunakan model 

x/ = Uf + a; i = I, ..., p (p = 6 ) ( 1 ) 

dengan x/ mewakili pengamatan pada peubah ke-/, f adalah peubah 
acak yang menerangkan faktor umum (diidentifikasi sebagai tingkat 
intelegensia) bersama untuk semua peubah x/, dan s adalah peubah 
acak yang mewakili faktor khusus (diidentifikasi sebagai kemampuan 
khusus pada uji pelajaran tertentu) yang hanya ada pada masing- 
masing x/, dan U adalah konstanta yang tak diketahui. Dengan 
mengasumsikan bahwa var(f) = of 2 , vor(s) = <£, cov(s, = 0, untuk / */, 
dan cov(s , f) = 0 , rasio dari koefisien korelasi akan memenuhi sifat 
konstan. Jelasnya, untuk / *k, i = L ..., p, 

cov(x ; , x j ) _ L J 
cov(x,, x k ) L k 
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tidak tergantung pada /'. Spearman menggunakan pengamatan ini 
untuk menguatkan pendapatnya bahwa ‘semua cabang kegiatan 
intelektual memiliki fungsi dasar yang sama, sedangkan unsur spesifik di 
setiap kegiatan berbeda-beda’. Dua faktor di atas (faktor bersama 
dan faktor khusus) kedengaran kurang memadai untuk menerangkan 
fenomena tersebut. Sehingga, secara alamiah beberapa faktor 
bersama dan satu faktor khusus dimasukkan dalam model yang dikenal 
dengan model faktor. 

8.2. Model Faktor 

Misalkan x adalah vektor acak dengan vektor rata-rata n dan matriks 
ragam peragam E, dan hubungan antar unsur vektor x dapat dituliskan 
dalam model faktor 


x = [i + Lf + 8 (2) 

dimana ^ adalah vektor konstanta, f adalah vektor acak dengan 
ukuran kx/ (k < p), dengan unsur f/, ..., h, dan disebut faktor bersama, L 
adalah matriks konstanta yang tidak diketahui nilainya berukuran pxk, 
disebut loading faktor, dan unsur-unsur si, ..., s P adalah unsur vektor 
acak c yang disebut faktor khusus. Dalam hal ini diasumsikan bahwa 
vektor f dan s saling tidak berkorelasi. Jadi model di atas berimplikasi 
bahwa untuk unsur x tertentu, misalkan Xi yang mewakili 
pengukuranpada peubah tertentu dapat dituliskan sebagai kombinasi 
linear dari seluruh faktor bersama dan sebuah faktor khusus su Atau 
dituliskan, 

X/ = JU] + lllfl + ... + llkfk + 81 
X2 = JU2 + \2lfl + ... + hkfk + 82 


Xp - JUp + Iplfl + ... + Ipkfk + 8p 


139 


dimana /</, unsur ke-(/, j ) dari matriks L, adalah loading faktor untuk faktor 
bersama f/ terhadap x/. Jika k = 1 maka model faktor tersebut tereduksi 
menjadi model Spearman seperti pada sub bab sebelumnya. 

Dalam permasalahan analisis faktor yang dilakukan adalah 
menentukan faktor-faktor bersama sehingga korelasi di antara unsur 
vektor x terangkum pada faktor-faktor yang diperoleh. 

Model faktor di atas menggunakan asumsi bahwa 

- E(f) = 0 

- E [e) = 0 
cov(f, e) = 0 

var(f) = A definit positif 

(//, 0 • • • 0 

0 y/ 2 ■■■ 0 

var(s) = \|/ = . . . dengan w > 0 

_0 0 ••• y/ p _ 

Dengan asumsi di atas maka dari persamaan (2) dapat diturunkan 
bahwa 

var(x) = E = LAL’ + vj/ 

Karena L dan f keduanya tidak diketahui persamaan model (2) setara 
dengan menuliskan 

x = [i + LA 1/2 A' 1/2 f + s 
= [i + LT + 8 

dimana L* = LA 1/2 dan f* = A~ 1/2 f. Dengan bentuk model ini maka matriks 
ragam-peragam bagi vektor x adalah 

var(x) = E = L*L*’ + \\j 
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Tanpa mengurangi makna untuk kasus secara umum, kita asumsikan 
bahwa var(f)=lk, berupa matriks identitas, sehingga menghasilkan 

var(x) = S = LL’ + vj/ (3) 

Model pada persamaan (2) dan asumsi persamaan (3) merupakan 
model faktor baku yang banyak digunakan. Tujuan analisis ini adalah 
menentukan L dan vj/ sehingga asumsi pada persamaan (3) terpenuhi. 
Penentuan ini menjadi masalah utama dalam analisis faktor. 

Perhatikan bahwa cov(x, f) = L, atau cov(x/, f/) = /,y. Hal ini berimplikasi 
bahwa peragam dari vektor acak x dan vektor dari faktor bersama f 
secara lengkap ditentukan oleh matriks loading faktor L. Juga dapat 
dilihat bahwa corr(x/, f/) = lijHoa = /y, jika var(x/) = oa = 1, yaitu ketika S 
berupa matriks korelasi. Pada kasus ini, matriks loading faktor tidak lain 
adalah matriks koefisien korelasi antara peubah asal dengan faktor 
bersama. 

Misalkan vektor berukuran pxl, /, dan \\ adalah baris ke-i dan ke-j dari 
matriks L. Maka untuk i *j, 

Oij = COV(Xi, Xj) = li’lj = lilljl + Ii2lj2 + ... + likljk 


dan 


oa = var(xi) = li’li + \fA 


- I 2 il + l 2 \2 + ... + / 2 ik +lfA 


= h 2 i + \fA 

dengan h 2 / = li’li. Jadi ragam dari x, diuraikan menjadi dua komponen 
ragam, yaitu = h 2 / dan yang masing-masing berpadanan dengan 
faktor bersama dan faktor khusus. Besaran \ja adalah kontribusi faktor 
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khusus a yang disebut ragam khusus, sedangkan h 2 / adalah kontribusi 
faktor bersama dan disebut komunalitas ragam bersama. Lebih lanjut, 
l 2 i adalah kontribusi faktor bersama pertama terhadap ragam 
bersama, l 2 2 adalah kontribusi faktor bersama kedua terhadap ragam 
bersama, dan seterusnya. 


Ilustrasi. 

Misalkan diketahui matirks korelasi berikut 


P4x4 — 


1.00 

0.51 

0.35 

0.20 


0.51 

1.00 

0.21 

0.06 


0.35 

0.21 

1.00 

0.35 


0.20 

0.06 

0.35 

1.00 


Dapat diperksa bahwa p = LL’ + vj/, dengan memilih matriks loading 
faktor 

" 0.8 - 0 . 1 “ 

0.6 - 0.3 
L_ 0.5 0.5 

0.3 0.4 _ 

dan matriks ragam khusus 

' 0.35 0 0 0 ' 

0 0.55 0 0 

0 0 0.50 0 

0 0 0 0.75 
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Sehingga p memiliki struktur faktor yang dihasilkan dengan k = 2 faktor. 
Komunalitas dai xi adalah h 2 i = l 2 n + I 2 i 2 = (0.8) 2 + (-0.1 ) 2 = 0.65. Ragam 
khusus untuk x/ adalah y/i = 0.35. Telah diperlihatkan bahwa h 2 i + y/i = 1 
= cni. Hal yang serupa juga dapat dilakukan untuk X 2 , X 3 , dan X 4 . 
Selanjutnya corr[xi, fi ) = 0.8, corr(x/, f 2 ) = -0.1, corr(x 2 , fl) =0.6, dan 
seterusnya. 

Umumnya, penguraian secara tepat matriks korelasi p ataupun matriks 
ragam peragam S menajadi LL’ + vj/ tidak selalu mungkin diperoleh. 
Persamaan p = LL’ + vj/ dalam faktor analisis hanya terpenuhi pada 
kondisi tertentu berkaitan dengan nilai p dan k. Selalu, kita 
menginginkan banyaknya parameter yang tak diketahui pada model 
faktor lebih sedikit daripada yang di dalam matriks S. Perhatikan 
bahwa S pada bagian kiri persamaan S = LL’ + vj/ memiliki p(p+l)/2 
unsur yang berbeda, sedangkan disebelah kiri L memiliki pk unsur dan \\j 
memiliki p unsur, sehingga totalnya pk+p parameter. Jadi untuk model 
faktor diperlukan bahwa 

^^2 ^ _ + p) > 0 atau p > 2k. 

Jika p > 2k, solusi tepat untuk persamaan S = LL’ + y, dalam bentuk L 
dan \\j memungkinkan pada kasus sederhana. Sebagai contoh p = 3 
dan k = 1 


x/ = hf + si 


X2 = hf + 82 


X3 =hf + £3 


maka 
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E = LL+v|/ = 


V 


Vi 

0 

0 “ 

h 

Il ^2 ^3 J' 

0 

^2 

0 

h. 


0 

0 

^ 3 _ 


Sehingga 


"^11 

^12 

^13 



l x l 2 

hh 


Vi 

0 

0 " 

G 21 

^22 

^23 

= 

l 2 l x 

ll 

l 2 l 3 

+ 

0 

^2 

0 

_ < J 3 \ 

^32 

< J 33 _ 


/ 3 /l 

/ 3 / 2 

l 3 


0 

0 

^ 3 _ 


menyelesaikan persamaan di atas untuk mendapatkan /,• dan ^,/ = 1,2, 
3, menghasilkan 


/ 


2 

1 


23 


r 2 _ ^23^12 
^2 _ 


'13 


( 4 ) 


dan 


r 2 _ < J \ 3 <J 23 


12 


= 0-11 “A - 


^2 — 22 ^ 2 

( 5 ) 


W 3 — ^33 i 


2 

3 


Jadi paling tidak pada kasus khusus ini, solusi tepatnya dapat dengan 
mudah diperoleh. Tetapi pada beberapa kasus, solusi tepat ini tidak 
wajar. Misalnya saja jika matriks korelasi yang terlibat adalah sebagai 
berikut 


1.00 

0.75 

0.95 

0.75 

1.00 

0.85 

0.95 

0.85 

1.00 


144 



Menggunakan formula-formula yang diberikan pada persamaan (4) 
dan (5) di atas akan didapatkan l 2 i = 0.838, l 2 2 = 0.671, l 2 3 = 1.077, i//i = 
0.162, y /2 = 0.329 dan = -0.077. Padahal ya adalah ragam dari 
peubah acak (yaitu £ 3 ), sehingga tidak boleh negatif. Dengan kata 
lain, solusi yang didapatkan tidak wajar. Situasi seperti ini dalam 
banyak literatur disebut sebagai solusi tak wajar atau kasus Heywood. 
Kita akan membahas kasus ini pada sub-bab lain. 

Model faktor pada persamaan (2) tidak unik karena dua pasang (L, f) 
dan (L*, f*) yang berbeda menghasilkan struktur matriks ragam 
peragam S yang sama. Misalkan saja r adalah sembarang matriks 
ortogonal berukuran k x k. Maka model pada persamaan (2) dapat 
ditulis ulang sebagai 

x = [i + Lrr’f + e 


= H + L* f + 8 


dengan L* = Lr dan f = r’f. Perhatikan bahwa E(f) = E(r’f) = r’E(f) = 0, 
dan var(f) = var(r’f) = r’ var(f) r = r’ r = k. Sehingga sembarang 
transformasi ortogonal terhadap f akan menghasilkan struktur peragam 
yang sama untuk S, yaitu 

S = LL’ + vj/ 

= l r r L’ + y 

= L* L*’ + y 

Lebih jauh, komunalitas h 2 / masih sama karena LL’ = L*L*’. Walaupun 
komunalitas dan struktur peragam tidak berubah, tapi besarnya 
loading faktor sangat tergantung pada matriks transformasi ortogonal 
r. 
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Syarat Keunikan 


Permasalahan ketidakunikan dari loading faktor sebenarnya dapat 
memberikan keuntungan tersendiri, karena semua kemungkinan 
loading faktor saling berkaitan melalui transformasi ortogonal sehingga 
kita dapat memilih matriks loading faktor L tertentu yang selain 
memenuhi persamaan (3) juga memiliki sifat-sifat yang lebih bermakna. 
Dalam banyak hal, seringkali kita menginginkan L adalah matriks yang 
memenuhi sifat bahwa L’vj/L merupakan matriks diagonal dengan unsur 
positif, atau 


LVL 


8 , 0 

0 s 2 


0 

0 


, dengan S > 0, i = 1,2. k 


0 0 - s k 


Relevansi dari tambahan syarat ini dapat dijelaskan sebagai berikut. 
Misalkan f adalah peubah normal ganda-k dengan vektor rataan 0 
dan matriks ragam peragam k. Misalkan pula sebaran bersyarat x 
terhadap f adalah peubah normal ganda-p dengan vektor rataan n + 
Lf dan matriks ragam-peragam i|/. Maka dapat ditunjukkan bahwa 
sebaran bersyarat f terhadap x adalah normal ganda-k dengan vektor 
rataan L’S- 1 (x - n) dan matriks ragam peragam [L’vj/^L + Ik] 1 . Syarat 
yang disebutkan pada persamaan (6) memastikan bahwa matriks 
loading faktor L yang akhirnya diperoleh berdasarkan x menghasilkan 
komponen f yang saling bebas. 

Kendala yang diberikan pada persamaan (6) mengurangi k(k-l)/2 
batasan linear (unsur non-diagonal matriks simetrik LV 1 !. semuanya 0) 
pada jumlah parameter model faktor. Dengan demikian, syarat baru 
agar analsis faktor memiliki makna adalah 
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>0 


(7) 


PiP± 1 ) 

2 


pk + p 


kik- 1) 


Sebagai contoh, dari pertidaksamaan (7) untuk k - 3, agar bermakna 
maka dibutuhkan p > 6, sedangkan jika k - 4 memerlukan p > 8. 

Aspek yang paling penting pada analisis faktor adalah menduga 
loading faktor dan ragam khusus. Misalkan xi, x n adalah contoh 
acak dari sebaran ganda-p dengan E(x) = ^ dan var(x) = E. Analisis ini 
terdiri atas dua bagian: 

mengidentifikasi struktur 
menduga parameter 

Jika model faktor yang sesuai telah diidentifikasi dan parameter- 
parameter yang terlibat telah diduga, berikutnya adalah memberikan 
makna yang tepan dan menginterpretasi loading faktor hasil dugaan. 
Loading faktor yang diduga umumnya dirotaasi (ditransformasi 
menggunakan transformasi ortogonal), karena ketidakunikan solusi, 
untuk membantu menginterpretasikannya. 

Identifikasi struktur yang lebih sederhana adalah menentukan k (< p) 
yang tepat sehingga model gaktor pada persamaan (2) terpenuhi. 
Hampir selalu, penentuan banyaknya k ini dilakukan secara subjektif, 
meskipun pada beberapa kasus, misalkan padapenggunaan meode 
pendugaan kemungkinan maksimum, pendekatan sistematik untuk 
menguji hipotesis dimungkinkan untuk dilakukan. Ide-ide pemilihan 
banyaknya komponen utama pada analisis komponen utama juga 
dapat digunakan untuk menentukan banyaknya faktor bersama, yaitu 
k. 

Menyelesaikan masalah analisis faktor secara tepat adalah pekerjaan 
yang sulit. Inilah alasan banyaknya pendekatan yang berbeda-beda 


147 



dan sudut pandang yang dikemukakan ahli-ahli dalam menghadapi 
masalah ini. Untuk memudahkan diskusi, kami memabgai berbagai 
metode menjadi dua kategori besar (a) metode non-iteratif, dan (b) 
metode iteratif. 

Seperti pada kasus analisis komponen utama, titik awal kerja pada 
analisis faktor adalah matriks ragam peragam contoh atau matriks 
korrelasi contoh dari data yang didapatkan. Semua metode yang 
akan dibahas berikut ini, dapat dilakukan baik untuk matriks ragam- 
peragam maupun untuk matriks korelasi. Karena sebagian besar 
metode tidak tergantung pada skala maka pada analisis faktor 
umumnya digunakan matriks korelasi. Walaupun begitu, ada juga 
metode yang tergantung pada skala, artinya penggunaan matriks 
korelasi dan matriks ragam-peragam akan menghasilkan output yang 
berbeda. 

8.3. Metode Pendugaan Non-lteratif 

Pada pembahasan-pembahasan berikut, kita akan selalu 
menggunakan matriks korelasi sebagai dasar analisis. Metode yang 
termasuk dalam kelompok non-iteratif ini antara lain: metode 
komponen utama (principal componenf method), metode faktor 
utama (principal factor method ), analsis citra ( image analysis), dan 
analisis faktor kanonik non-iteratif Harris (Harris’ non-iterative canonical 
factor analysis). 

8.3.1. Metode Komponen Utama 

Metode komponen utama pada analisis faktor adalah metode yang 
paling sederhana. Misalkan R adalah matriks korelasi contoh berukuran 
p x p. Karena matriks R adalah simetrik dan definit positif maka dapat 
dituliskan sebagai 
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R = TAF 


Dengan A adalah diagpu, .... A, P ), dan A,i > ... > X P > 0 adalah akar ciri 
matriks R, serta IT’ = r’ r = l P , dengan r adalah matriks ortogonal p x p 
yang kolom-kolomnya adalah vektor ciri matriks R , yaitu F, r P yang 
berpadanan dengan vektor ciri A,i, ..., X P . Misalkan k adalah 
banyaknya komponen utama yang dipilih menggunakan kriteria 
tertentu, misalnya banyaknya komponen utama minimum yanga 
mampu menerangkan persentase keragaman total. Kita 

mendefinisikan matriks L berukuran p x k sebagai 

L = ^Tj _ (10) 

maka, R didekati dengan 

LL' = 

1=1 

dimana r adalah kolom ke-/ pada matriks r. 

/V 

Jadi L = (/..) yang diberikan pada persamaan (10) merupakan 
penduga matriks loading faktor L. Matriks diagonal ragam khusus \\j 
diduga dengan \j/ , yaitu matriks diagonal yang unsurnya diambil dari R 

LL 


l-hl 0 ••• 0 

0 1 -h 2 2 ••• 0 

0 0 ••• 1 -h 2 p 


k 

dimana h 2 , = ^ , i = 1,2.p 

1=1 
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Dengan demikian kita memiliki model k-faktor dengan L diduga oleh L 
dan \\j diduga dengan \j/, sehingga diperoleh pendekatan bagi R 
adalah 


R* LL' + \j/ 

Dalam prakteknya kita harus melakukan validasi model, sehingga 
sebelum menerima L dan \j/ sebagai penduga akhir, perlu dihitung 
matriks sisaan 


Res = R - (LL' + lj/ ) 

dan besaran dari unsur-unsurnya diperhatikan menggunakan ukuran 
statistik tertentu atau secara intuitif. 

Matriks sisaan Res selalu memiliki unsur diagonal nol. Pada kasus yang 
ideal, Res = 0 . Dengan demikian, dalam bahasa intuitif, jika unsur non- 

diagonal juga dekat dengan nilai 0 maka penduga L dan \j/, 

dianggap cukup bagus dan dapat diterima. Hal ini memicu 
munculnya statistik untuk menilai mutu dari pendugaan. 

k 

Secara formal, jika k terpilih sehingga yang merupakan 

i=1 

keragaman total yang diterangkan oleh k buah vektor ciri besar 

p 

(mendekati p) maka akan kecil (mendekati 0). Bisa ditunjukkan 

i=k +1 

bahwa jumlah kuadrat dari unsur-unsur matriks sisaan Res selaku kurang 
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p p 

dari atau sama dengan '^A i (Rao, 1964). Sehingga jika kecil, 

i=k +1 i=k +1 

ini juga menunjukkan bahwa matriks sisaan itu kecil. Atau besaran 


p p 

2>, E A 

i-k+l i-k+1 



P 


dapat dijadikan ukuran kebaikan suai dari model faktor. Semakin kecil 
nilainya mengindikasikan kebaikan suai yang tinggi. Perlu ditegaskan 
bahwa jika yang digunakan bukan matriks korelasi melainkan matriks 

p 

ragam peragam, maka tidak selalu sama dengan p. 

i=1 


Ilustrasi. 


Kembali menggunakan data yang digunakan oleh Spearman pada 
sub-bab sebelumnya, kita bekerja dengan menggunakan matriks 
korelasi 


c 

1.00 

0.83 

0.78 

0.70 

0.66 

0.63 

F 

0.83 

1.00 

0.67 

0.67 

0.65 

0.57 

E 

0.78 

0.67 

1.00 

0.64 

0.54 

0.51 

M 

0.70 

0.67 

0.64 

1.00 

0.45 

0.51 

D 

0.66 

0.65 

0.54 

0.45 

1.00 

0.40 

Mu 

0.63 

0.57 

0.51 

0.51 

0.40 

1.00 
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Penguraian spektral matriks di atas mendapatkan nilai akar ciri sebagai 
berikut: 4.1028, 0.6191, 0.5117, 0.3570, 0.2704, dan 0.1389. Jika 
digunakan kriteria bahwa faktor yang diambil berpadanan dengan 
akar ciri yang lebih dari 1, maka kita dapatkan k = 1, sehingga bentuk 
matriks loading faktornya berupa vektor saja, dan diperoleh / = (/i, ..., 
/ p ), dengan p = 6 adalah 

/ = (0.9365, 0.8940, 0.8420, 0.8024, 0.7426, 0.7207) 

Karena k = 1, maka penduga komunalitasny h 2 / = Ih, i = 1, ..., 6 
berpadanan dengan enam peubah yang terlibat sehingga diperoleh 
0.8771,0.7992, 0.7090, 0.6467, 0.5514, dan 0.5194. Sebagai contoh untuk 
h 2 i = l 2 i = (0.9365) 2 = 0.8771. Penduga untuk total komunalitas adalah 

M.1028 

i =1 i =1 

Nilai ini hanya 68.4% dari total keragaman 6 peubah asal. Ragam 
khusus untuk masing-masing enam peubah diperoleh dari i/a - 1 - h 2 /, / = 
1, ..., 6, yaitu 


0.1229, 0.2008, 0.2910, 0.3533, 0.4486, 0.4806 
Informasi-informasi di atas dapat dirangkum pada tabel berikut 



C 

F 

E 

M 

D 

Mu 

Loading Faktor 

0.9365 

0.8940 

0.8420 

0.8042 

0.7426 

0.7207 

Komunalitas 

0.8771 

0.7992 

0.7090 

0.6467 

0.5514 

0.5194 

Ragam khusus 

0.1229 

0.2008 

0.2910 

0.3533 

0.4486 

0.4806 

RMS 

0.0353 

0.0548 

0.0706 

0.0813 

0.0986 

0.0895 
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Matriks sisaan Res = R - ( LL' + \j/ ) memberikan indikasi seberapa bagus 

model faktor mampu mengepas data. Berdasar data di atas 
didapatkan 


0.0000 

- 0.0072 

- 0.0072 

0.0000 

- 0.0086 

- 0.0828 

- 0.0531 

- 0.0489 

- 0.0354 

- 0.0138 

- 0.0450 

- 0.0743 


Res = ( res,j ) = 
- 0.0086 - 0.0531 
- 0.0828 - 0.0489 
0.0000 - 0.0371 

- 0.0371 0.0000 

- 0.0853 - 0.1472 
- 0.0969 - 0.0696 


- 0.0354 

- 0.0450 

- 0.0138 

- 0.0743 

- 0.0853 

- 0.0969 

- 0.1472 

- 0.0696 

0.0000 

- 0.1352 

- 0.1352 

0.0000 


Salah satu ukuran untuk menilai kebaikan suai adalah menggunakan 
RMS_overall yaitu akar kuadrat tengah dari seluruh unsur non diagonal 
matriks Res, atau 


RMS_overall = 


1 


P(P~ !) /=i 


y y 


res l 


J ^ 1 


Nilai RMS_overall untuk kasus di atas adalah 0.0748. Meskipun tidak 
adai keseragaman aturan unruk menenrukan batasan dari RMS_overall 
ini, namun beberapa pendapat menyatakan bahwa nilai 0.05 dapat 
digunakan. Artinya jika diperoleh RMS_overall yang kurang dari 0.05 
dengan banyaknya faktor bersama paling sedikit, itulah yang diambil 
sebgai model terbaik berdasarkan kriteria ini. 

Untuk melakukan evaluasi terhadap masing-masing peubah, dapat 
juga didapatkan RMS di setiap peubah, yang didapatkan 
menggunakan formula 
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RMSi = 



Sehingga misalkan untuk peubah C didapatkan 




0072) 2 +(-0.0086) 2 


+ (-0.0531) 2 + (-0.0354) 2 +(-0.0450) 2 


= 0.0353 

Mungkin ada faktor bersama lain yang kalau dimasukkan ke dalam 
model akan meningkatkan persentase keragaman total yang 
diterangkan melalui komunalitas dari faktor-faktor. Namun, 
memasukkan faktor tambahan ini tidak selalu dapat menurunkan RMS. 

Petunjuk berapa banyak faktor yang diikutsertakan dalam model faktor 
kadang-kadang dilakukan dengan menggunakan grafik yang disebut 
SCREE DIAGRAM. Grafik ini menampilkan nilai akar ciri dari matriks 
korelasi lawan k, k = 1, p. Dengan grafik ini, k, banyaknya faktor, 
dipilih sedemikian rupa sehingga gradien dari grafik tersebut curam di 
sebelah kirinya dan sangat landai ke sebelah kanan. Diagram ini 
serupa dengan yang digunakan pada analisis komponen utama. 

Scree diagram pada kasus di atas adalah sebagai berikut 
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5 



Dari diagram di atas diperoleh bahwa minimal dua faktor diperlukan 
pada model. Jika dipilih k = 2 akan diperoleh RMS_overall 0.0771, yang 
mengidikasikan bahwa model faktor dengan dua faktor bersama tidak 
memperbaiki hasil. Bahkan nilai RMS_overall ini lebih tinggi daripada 
ketika k = 1. Selanjutnya, total keragaman yang mampu diterangkan 
oleh dua buah faktor ini adalah 


/L| + X 2 
/ 1 ^ + • • • + 


78.7% 


Jika dicoba menggunakan k = 3 dan k = 4 berturut-turut akan diperoleh 
RMS_overall sebesar 0.0541 dan 0.0384, yang memperlihatkan 
perbaikan berarti dibandingkan ketika k = 1 atau k = 2. Komunalitas 
yang dihasilkan dengan menggunakan model tersebut adalah 87% 
dan 93%. Sebagai bahan perbandingan, tabel berikut menyajikan RMS 
setiap peubah dan RMS_overall untuk berbagai k. 



C 

F 

E 

M 

D 

Mu 

Overall 

k = 1 

0.0353 

0.0548 

0.0706 

0.0813 

0.0986 

0.0895 

0.0748 

CN 

II 

-V 

0.0346 

0.0510 

0.0706 

0.0836 

0.0867 

0.1114 

0.0771 

k = 3 

0.0343 

0.0510 

0.0715 

0.0747 

0.0511 

0.0213 

0.0541 

k = 4 

0.0322 

0.0513 

0.0279 

0.0425 

0.0466 

0.0212 

0.0384 
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8.3.2. Metode Faktor Utama 


Metode ini didasarkan pada penggunaan metode komponen utama 
terhadap matriks korelasi semu (atau matriks ragam-peragam semu), 
yaitu diperoleh dengan mengganti unsur diagonal dengan 
komunalitas. 

Misalkan struktur faktor yang diberikan pada persamaan (3) R = LL’ + \\i, 
berlaku untuk suatu nilai k, seperti sebelumnya k adalah banyaknya 
faktor. Maka matriks korelasi semu R - vj/ = LL’ merupakan matriks 
simetrik semidefinit positif dengan pangkat k. Tujuan kita adalah 
menduga L. Menggunakan penguraian spektral terhadap R - y 
menghasilkan 


r - m/ = ta r 


dimana A = diag(2i, ..., Ak, 0, ..., 0), dan h > ... > Ak > 0 adalah akar ciri 
dari matriks korelasi semu, dan r adalah matriks vektor ciri 
padanannya. Dengan demikian matriks L dapat diperoleh melalui 




dengan T, adalah kolom ke-/ dari matriks r. Dalam prakteknya untuk 
matriks R yang diketahui dan vj/ = \j/ , R - \j/ mungkin saja berpangkat 

penuh. Jadi dengan menggunakan T sebgai penduga r, dan A 
sebagai penduga A, melalui penguraian 


Ra = R- »j/ = r AT' 


Kita menduga L sebagai 
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dimana I\ adalah kolom ke-/ dari matriks T . Sehingga kita menduga 
L dengan mendekati menggunakan L yang memenuhi struktur faktor 

R « L L ’ + \j/ , untuk vj/ = \j/ yang telah ditentukan. 


Misalkan matriks korelasi R dan matriks dugaan ragam khusus \j/ telah 

ditentukan. Maka menggunakan hf- 1 - \j / i , i = 1, ..., p kita dapat 
memperoleh penguraian spektral 



r ^ o 
h; 

r i2 



Ra = R - \j/ = 

r i2 

... 

'• r 2p 

= f A f 


/pl 

r p2 ■ 

•• K_ 



Andaikan k’ adalah banyaknya unsur diagonal A yang tidak sama 
dengan 0, yaitu h, ..., Ak, dan f.,..., T k , adalah vektor ciri R - \j/ 
yang berpadanan dengannya. Meskipun R - y matriks yang definit 
positif dengan pangkat k, namun R a = R - \j ) dapat memiliki akar ciri 
yang negatif. Kita mengambil k’ sebgai penduga k. Pada metode 
faktor utama, k sebagai penduga k dipilih sehingga memenuhi k < k’ 

< k, dan ^ X i dekat dengan penduga totaal komunalitas hf 
= fr(R - \j/ ). Dengan dasar ini matriks L diduga dengan 


L = 


/ /V /\ / /V /\ 

VArj-iAr. 
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Pendugaan L yang dinyatakan di atas ditentukan tergantung pada \j/ 
yang ditentukan atau pada komunalitas hf . Artinya pada saat 

menggunakan metode ini, kita harus menentukan matriks \j/ atau 

menentukan komunalitasnya. Ada banyak cara menentukan hal ini, 
dan kita akan bahas beberapa di antaranya. 

83.2.L Pendugaan menggunakan Squared Multiple 
Correlation (SMC) 

Misalkan R - 1 = (P) adalah matriks kebalikan dari matriks korelasi R. 
Pendekatan yang dapat digunakan untuk menduga - adalah y/• = 1 /r", 
i = 1, ..., p. Hal ini setara dengan melakukan pendugaan terhadap 
komunalitas h 2 ,- dengan hf = 1 - i// i = 1 - 1 /r' 7 = SMC/, yaitu sebesar 

kuadrat dari koefisien korelasi ganda antara x/, komponen ke-/ pda 
vektor peubah x, dengan (p - 1) komponen x lainnya. Matriks korelasi 

semu R a pada persamaan (12), dengan mengganti h 2 / dengan /z. 
sekarang digunakan untuk melakukan analisis faktor. Total komunalitas 
tidak lain diduga menggunakan ^ff_ } SM C- . 


83.2.2. Pendugaan menggunakan nilai mutlak korelasi 
yang terbesar 

Metode intuitif lain yang dapat digunakan untuk menduga komunalitas 
h 2 i adalah menggunakan 


r ,nl = max I r v I 

l*J 

yaitu nilai terbesar dari nilai mutlak koefisien korelasi pada unsur non- 
diagonal baris ke-/ dari matriks R. Sehingga 
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83.2.3. Pendugaan menggunakan Adjusted Squared 
Multiple Correlation (ASMC). 

Z p (i) 

r max 

adalah penduga total komunalitas V P /r 2 yang lebih baik daripada 

SM C- . Sehingga mereka menyarankan dilakukan penyesuaian 

(pengkoreksian) terhadap kuadrat dari korelasi ganda untuk menduga 

Z P i 2 ^~^P (i) 

^n i masih didugan menggunakan / • Yang 

mereka usulkan adalah sebagai berikut 

p 

V r U) 

/ j max 

h 2 = ASMCi = - S MC ,/=l. P 

i p l 1 

SSMC ; 

7=1 

Dari persamaan di atas, kondisi bahwa h? diduga dengan 

Z P (i) 

i=l r max tetap terpenuhi. 

8.3.3. Analisis Citra ( Image Analysis ) 

Meskipun pada analisis faktor secara jelas sisebutkan di dalam 
modelnya bagaimana faktor bersama dan faktor khusus berhubungan, 
identifikasi terhadap bagian-bagian ini seringkali dilakukan 
menggunakan trial and error. Untuk mengatasi ketidakmampuan dari 
analisis faktor menyatakan secara eksplisit faktor bersama dan faktor 
khusus pada sebuah peubah, Guttman (1953) memperkenalkan 
sebuah metode yang sekarang populer dengan nama analisis citra. 
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Hal utama yang mencolok pada metode ini adalah kemampuan 
secara eksplisit mendefinikan bagian faktor bersama pada peubah. 
Guttman mengatakan ‘bagian faktor bersama pada sebuah peubah 
adalah bagian yang dapat diprediksi menggunakan korelasi linear 
ganda dari semua peubah lain pada gugus peubah tersebut.’ Bagian 
bersama dari peubah ini disebut sebagai image dari peubah tersebut 
berdasarkan peubah lain. Bagian khusus dari peubah tersebut adalah 
sisaan yang tidak dapar diprediksi. Bagian khusus ini disebut sebagai 
anti-imoge dari peubah. Dengan menggunakan terminologi analisis 
regresi, image dan anti-image dapat dijelaskan sebagai berikut. 

Misalkan x adalah vektor acak berukuran p x J yang telah dibakukan 
sehingga matriks ragam-peragamnya tidak lain adalah matriks korelasi 
R, dan diasumsikan non-singular. Jika model regresi 

x/ = J3] x i + ... + 1 + fixi+i + ... + /?p -1 Xp + a 

digunakan untuk meprediksi x/, maka penduga kuadrat terkecil bagi x, 
adalah x t yaitu 


*i ®^12(0^22(0 X 2(0 

dimana x = (xi, x’ 2 (i)J, X 2 (i) adalah vektor yang memuat seluruh peubah 
kecuali x/, serta matriks R dipartisi menjadi 

1 ®12(i) 

R_ R R 

_ rv 21(0 rv 22 ( 0 _ 

Misalkan sisaan s t diperoleh dari s i = Xi - x t . Maka x/ dapat dituliskan 

dalam bentuk bagian bersama dan bagian khusus, atau image dan 
anti-image menjadi 


Xi= X, + £, , i= 1.p 
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Dalam bentuk vektor, p buah persamaan di atas dituliskan sebagai 

x = x + £ (13) 

dimana x = (x/, x p )’, x= [x lt ..., x )' dan £ = (s lt ..., £ )’. 

Selanjutnya telah dibuktikan bahwa 

x = (l-MR)x 

dengan M adalah matriks diagonal yang unsur diagonalnya diambil 
dari unsur diagonal matriks R' 1 . Melalui pendefinisian W = I - M R kita 
dapat menuliskan ulang persamaan (13) menjadi 

x = Wx + (I - W)x 

= imoge + onti-imoge 

Perhatikan bahwa matriks ragam peragam dari imoge adalah 

var(Wx) = WRW’ (14) 


= (l-MR 1 ) R (l-MR 1 )’ 

= R + MR 1 M-2M 

Perlu menjadi catatan bahwa unsur diagonal utama pada matriks 
ragam peragam adalah kuadrat dari koefisien korelasi berganda dari 
sebuah peubah dengan peubah-peubah lainnya. Pada analisis faktor 
metode image dan menggunakan matriks korelasi R, matriks ragam- 
peragam dari image pada persamaan (14) dihitung terlebih dahulu. 
Kemudian berikutnya matriks inilah yang dijadikan bahan ekstraksi 
menggunakan metode komponen utama untuk menghasilkan faktor 
bersama. Faktor-faktor yang berpadanan dengan akar ciri dari WRW’ 
yang lebih dari atau sama dengan satu umumnya yang digunakan. 
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Ilustrasi. 


Jika digunakan data Spearman seperti pada ilustrasi sebelumnya, kita 
akan dapatkan matriks W dan WRW’ sebagai berikut 


W = 


0.0000 

0.5465 

0.6106 

0.2898 

0.4040 

0.4622 

0.3708 

0.0000 

0.0026 

0.2835 

0.3568 

0.1363 

0.3043 

0.0019 

0.0000 

0.2249 

0.0681 

0.0172 

0.1179 

0.1700 

0.1835 

0.0000 

- 0.0922 

0.1071 

0.1432 

0.1864 

0.0484 

- 0.0803 

0.0000 

- 0.0512 

0.1460 

0.0635 

0.0109 

0.0832 

- 0.0456 

0.0000 


dan 


WRW’ = 


0.8142 

0.7284 

0.6665 

0.6461 

0.5841 

0.5441 

0.7284 

0.7261 

0.6693 

0.5923 

0.5523 

0.5327 

0.6665 

0.6693 

0.6271 

0.5561 

0.5146 

0.5036 

0.6461 

0.5923 

0.5561 

0.5431 

0.4921 

0.4611 

0.5841 

0.5523 

0.5146 

0.4921 

0.4756 

0.4268 

0.5441 

0.5327 

0.5036 

0.4611 

0.4268 

0.4118 


Akar ciri dari matriks WRW’ ini adalah 3.4698, 0.0698, 0.0399, 0.0166, 
0.0025, dan 0.0002. Jika faktor yang digunakan hanya yang 
berpadanan dengan akar ciri yang lebih dari 1 maka hanya satu faktor 
bersama yang terpilih. Matriks (tapi berupa vektor, karena hanya satu 
faktor) loading faktor yang merupakan vektor ciri yang berpadanan 
dengan akar ciri pertama adalah 

(0.9724, 0.9073, 0.8329, 0.7778, 0.7057, 0.6720)’ 
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Nilai RMS_overall-nya adalah 0.0507, dan komunalitas dari setiap 
peubah berturut-turut adalah 0.9456, 0.8233, 0.6937, 0.6050, 0.4980, dan 
0.4516. 

8.3.4. Analisis Faktor Kanonik Non-lteratif Harris 

Rao (1955) memperkenalkan analisis faktor kanonik untuk menjawab 
pertanyaan ‘peubah faktor mana yang berhubungan paling erat 
dengan peubah teramati?’ Solusi untuk permasalahan ini ada 
kaitannya dengan analisis korelasi kanonik terhadap peubah faktor 
hipotetik dengan peubah teramati. 

Mengacu kepada model yang diberikan pada persamaan (2), matriks 
peragam antara x dan f adalah matriks berukuran (p+kj x fp+kj, yaitu 



X 


~E 

L 

var( 

f 

) = 

L' 

I 


Dengan mengasumsikan bahwa peubah-peubah telah dibakukan 
maka bentuk dari E adakan menjadi matriks korelasi p. Sehingga notasi 
p akan digunakan untuk menggantikan E. Tujuannya adalah menduga 
L dan y, dimana p = LL’ + \\j. Kuadrat dari koefisien korelasi kanonik 
antara x dan f diperoleh dari akar persamaan berikut 

| LL’ - vp | = 0 

Misalkan matriks p diduga menggunakan matriks korelasi contoh R dan 
misalkan juga bahwa dugaan awal bagi vj/ , \j/ telah tersedia. Maka 
kita menginginkan 


LL’ * R - \j> 
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Dengan mengguanakan L sebagai penduga L, dan L L ’ = R - \j/ , 
maka persamaan seberlumnya dapat ditulis ulang menjadi 

| R - \j> -vR | =0 


atau 


| \j/ -1/2 R \j> -1/2 _ | =0 


dengan X- 1/(1-v) 


Dalam penerapannya bukan R yang digunakan tetapi matriks korelasi 
semu Ra, yaitu dengan mengganti unsur diagonal R dengan h- . 
Sehingga persamaan yang berlaku sekarang adalah 

| \jjM/ 2 Ra \j/ X\ | = 0 

Karena R a tidak selalu berupa matriks definit positif, maka dengan 
penggantian ini akar ciri \j / - 1/2 R a \j/ - ] / 2 , yaitu X dapat bernilai negatif. 

Misalkan saja A l > ... > X k >0 adalah akar ciri \j ) ~ ]/2 R a vj/ - 1/2 yang 
bernilai positif dan Ti adalah matriks berukuran p x /c yang merupakan 
matriks vektor ciri padanannya. Kemudian disusun matriks A} /2 
sebagai 
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serta mendefinisikan L= \j/- 1/2 ri Aj /2 sebagai penduga bagi L. Jika 

mau, kita dapat memeperoleh penduga yang baru bagi vj/ sebagai \j/ 

= R - L L ’ dan melajutkan secara iteratif prosedur ini hingga tercapai 
kestabilan penduga komunalitas. Proses ekstraksi faktor ini besifat 
scale-invariant. Lebih jelasnya misalkan dilakukan transformasi 
penskalaan y = Dx, dimana D adalah matriks diagonal yang semua 
tandanya sama. Solusi bagi L tidak berubah meskipun data x diganti 
dengan data baru y. Hal ini karena solusi yang dihasilkan dari ekstraksi 
matriks 

(D \j/ D’) ] /2 DR a D’ (D vj/ D’)- 1 / 2 

yang berpadanan dengan y sama dengan yang diperoleh 
menggunakan vj/ - 1/2 R a \j/ - 1/2 pada x. Konsekuensinya penggunaan 

E maupun R menghasilkan solusi yang identik. 

Harris (1962) telah menunjukkan hubungan yang sangat penting antara 
analisis faktor kanonik yang dikembangkan Rao dengan analisis image 
yang dikembangkan Guttman. Menggunakan hasil dari Guttman 
bahwa jika k cukup kecil dibandingkan p maka [diag (R 1 )] _1 = vj/ jika p 
-> oo, dia mengusulkan suatu algoritma non-iteratif bagi analisis faktor 
kanonik dari Rao dengan cara mengekstraksi akar ciri dan vektor ciri 
dari matriks 
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[diag(R-')]'/ 2 R a [diag(R-')]>/ 2 


8.4. Metode Pendugaan Iteratif 

Banyak metode ekstraksi iteratif yang termotivasi oleh penggunaan 
metode kemungkinan maksimum. Sebagai alternatifnya, ada juga 
prosedur yang telah disusun tanpa mengasumsikan sebaran tertentu. 
Pada bagian ini kita akan membahas emapt metode iteratif yaitu: 
metode kemungkinan maksimum ( maximum likelihood rnethod), 
metode kuadrat terkecil tak-terboboti ( unweighted least squares / ULS), 
metode komponen utama iteratif (iterotive principal component 
method), dan analisis faktor alpha (a/pha foctor analysis). 

8.4.1. Metode Kemungkinan Maksimum 

Metode kemungkinan maksimum (MKM) pada analisis faktor dilakukan 
awalnya dengan mengasumsikan sebaran normal ganda 
diperkenalkan oleh Lawley (1940) dan algoritmanya kemudian 
dikembangkan oleh Joreskog (1967, 1977). MKM mengasumsikan 
bahwa matriks ragam peragam atau matriks korelasi semua peubah 
bersifat non-singular. Karena metode ini scole-invoriant maka kita 
dapat memperoleh solusi menggunakan salah satu matriks tersebut. 
Misalkan xi, ..., x n adalah contoh acak dari populasi yang menyebar 
normal ganda-p dengan vektor rataan n dan matriks ragam-peragam 
E, yang diasumsikan memiliki struktur peragam E = LL’ + i|/. 
Permasalahan analisis faktor dapat dipandang sebagai pencarian 
penduga kemungkinan maksimum bagi L dan v \j. 

Sudah diketahui bahwa rataan vektor contoh x merupakan penduga 
kemungkinan maksimum bagi \i. Untuk mendapatkan penduga 
kemungkinan maksimum bagi L dan vj/, kita gunakan matriks ragam- 
peragam contoh S sebagai penduga awal bagi E. Karena contoh 
diasumsikan bersal dari populasi yang menyebar normal ganda, maka 
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(n-l)S memiliki sebaran Wishart dengan derajat bebas (n-1) dan nilai 
harapan S adalah Z. Fungsi kepekatan peluang bagi S adalah L(S) 
diberikan oleh 


n -1 n —1 p +1 


S) 

2 


L(S) = c.ISI 2 ISI 2 2 e 


dengan c adalah konstanta. Sehingga log-likelihood dari L dan v \i , jika 
Z = LL’ + vj/ adalah 



(16) 


/n c - 


Penduga kemungkinan maksimum bagi L dan \\j diperoleh dengan 
memaksimumkan fungsi (16) dengan kendala k(k-l)/2 persyaratan 
kenunikan (Johnson & Wichern, 1998). 

8A1.L Penentuan banyaknya faktor bersama 

Terdapat beberapa metode yang dapat digunakan untuk 
menentukan banyaknya faktor bersama, antara lain: 

1. Uji Nisbah Kemungkinan (likelihood ratio test ) 

Salah satu keuntungan penggunaan metode kemunkinan 
maksimum pada analisis faktor adalah adanya cara untuk menguji 
hipotesis bahwa faktor sebanyak k adalah pilihan yang tepat, 
dengan k adalah bilangan bulat tak diketahui. Formalisasi ini 
menghilangkan perdebatan tentang kesubjektifan penentuan 
banyaknya faktor bersama. Hipotesis nol yang diuji pada uji 
nisbah kemungkinan ini adalah 


Ho : Z = LL’ + vj/, r( L) = k diketahui 
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Misalkan L , ij/, dan 1= LL + y adalah penduga 

kemungkinan maksimum bagi L, vj/ dan S, jika Ho benar, maka nilai 
maksimum untuk log dari fungsi kemungkinannya adalah 


In Lho = 


* 

c 


V 2 J 


Jika S merupakan matriks definit positif tak berstruktur, maka 
penduga kemungkinan maksimum bagi S adalah S, sehingga nilai 
maksimum untuk log dari fungsi kemungkinan menjadi 


In Lho = C 


n -1 


V 


t%[S- l S]-ln\S~ l S\ 


* n -1 

* c -^ 


Jadi jika Ho benar dan n sangat besar, maka statistik uji nisbah 
kemungkinan adalah 


-2 Ini 


= -2 In 


= (n - 


f 

V 

1 ) 


U 


L 


\ 

J 




-p 


(n 

/J(LL , +v) _1 S]-/n I (LL'+v) _1 S I -p 


= (n - 1) F(L j 

dimana F (L, \\j) = fl|[(LL' +\|/)“ 1 S] - /n I (LL’ +\|/) _1 S I 
mendekati sebaran khi-kuadarat dengan derajat bebar Y> i(p-k) 2 
- (p+kji. 
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Nilai derajat bebas di atas dihitung berdasarkan selisih antara 
banyaknya parameter yang diduga jika E tidak berstruktur dan 
banyaknya paremeter jika Ho benar. Ada sebanyak p(p+l)/2 
parameter jika tidak ada kendala pada E serta ada (pk + p) 
parameter jika hipotesis nol benar. Namun adanya kendala 
sebanyak k (k - l)/2 pada persyaratan keunikan mengurangi 
jumlah parameter yang diduga jika Ho benar. Sehingga derajat 
bebas dari uji ini adalah 


p(p+ i) 
2 


j pk + p- 


k(k- 1)] 

2 J 


= Vi [(p - /c ) 2 - (p + k)]. 


Pendugaan L dan \\j. Untuk mendapatkan penduga kemungkinan 
maksimum bagi L dan \\j, Joreskog (1977) mengusulkan proses iterasi 
peminimuman dua tahap. Pertama, untuk matriks \\j tertentu, 
minimum dari 

F(L, v) = fl|[(LL' +\|/)“ 1 S] - Cn I (LL’ +\|/)' 1 S I -p 

terhadap L didapatkan, misalkan saja nilai minimumnya adalah F( 

L ,v \j). Selanjutnya F( L , \\j) diminimumkan terhadap \\j. Algoritma 
ini terus dilakukan secara iterasi sehingga diperoleh dugaan bagi L 
dan \\j yang membuat minimum global dari F(L, vj/) tercapai. 

Rao (1955) menunjukkan bahwa solusi faktor yang dihasilkan oleh 
metode kemungkinan maksimum dengan menagasumsikan 
sebaran normal ganda sama dengan hasil pendugaan 
menggunakan analisis faktor kanonik yang dikembangkannya. 
Dengan demikian, untuk menduga loading faktor dan ragam 
khusus menggunakan metode kemungkinan maksimum, tidak 
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diperlukan asumsi kenormalan ganda. Namun untuk pengujian 
hipotesis, asumsi kenormalan ini tetap diperlukan. 

2. Kriteria Informasi Akaike (Akaike’s information criterion) 

Sebagai alternatif untuk menentukan banyak faktor yang sesuai 
dapat digunakan besaran Akaike’s information criterion (AIC), 
selain melakukan pengujian. AIC pertama kali diperkenalkan oleh 
Akaike (1973) untuk menduga banyaknya parameter dalam 
sebuah model, dan penerapannya pada analisis faktor dibahas 
pada tahun 1987. Dengan melibatkan k buah faktor dalam 
model, maka matriks ragam peragam S dapat dituliskan S = LkL’k + 
\\j, dengan Lk adalah matriks loading faktor berukuran p x k. 
Sehingga log dari fungsi kemungkinan yang berpadanan dengan 
model k-faktor ini berdasarkan pada data contoh acak dari 
populasi normal ganda-p, xi, ..., x n adalah 

ln L(k) =c+” Ji IL t L* +'¥\+tr((L k L k +T)-‘ S n )\, 

1 11 

dimana S n = — V (x. - x)(x. - x)' . Maka statistik AIC untuk 
n m 

model dengan k faktor didefinisikan sebagai 

AIC (k) = -2 ln L (k) + [2p(k+1) -k(k-l)] 

Model berfaktor k dengan k adalah nilai yang berpadanan 
dengan AIC (k) yang paling kecil dianggap sebagai model yang 
paling baik. Selain AIC, beberapa orang juga menggunakan 
kriteria lain yang disebut Schworz’s Bayesian Criterion (SBC) yang 
kegunaannya sama. 
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8.4.2. Metode Kuadrat Terkecil Tak-Terboboti 
(Unweighted Least Squares Method, ULS) 

Joreskog (1977) mengembangkan algoritma untuk menduga L dan vj/ 
secara iteratif, yaitu meminimumkan fungsi kuadrat terkecil 

Fu(L, m/) = y 2 f r (S - S) 2 « y 2 fr[(S - S) (S - S)] 

terhadap L dan \\j, dimana S = LL’ + y, dan LL’ adalah matriks diagonal 
berukuran k x k. Solusi permasalan ini diperoleh menggunakan 
algoritma yang disebut ULS. Meskipun metode ini tidak scole-invoriont, 
tapi metode ini memiliki kelebihan karena tidak mengasumsikan matriks 
ragam peragam (atau matriks korelasi) harus non-singular. Secara 
intinya, algoritma untuk metode ULS ini sama dengan algoritma iteratif 
dua tahap seperti yang dibahas pada bagian sebelumnya. 

Solusi menggunakan ULS pada analisis faktor ini juga ekuivalen dengan 
solusi yang diperoleh jika menggunakan metode lain yang kurang 
terkenal yaitu metode jumlah kuadrat sisaan minimum ( minimum 
residual sum of squares, MINRES) yang dikembangkan oleh Harman 
(1977). Karena itulah metode MINRES ini tidak didiskusikan di sini. 

8.4.3. Metode Faktor Utama Beriterasi 

Berharap mendapatkan penduga yang lebih baik untuk matriks 
loading faktor dan ragam khusus, kadang-kadang kita perlu melakukan 
iterasi terhdap metode faktor utama yang dibahas sebelumnya sampai 
perubahan pada penduga komunalitas akhir sudah lebih kecil 
daripada nilai yang ditentukan sebelumnya. Itulah ide dasar dari 
metode faktor utama beriterasi ini. 

A... 

Misalkan U 1 adalah penduga matriks loading faktor pada iterasi ke-/. 
Maka penduga bagi \\j pada iterasi berikutnya adalah 

V (,+1) = diag(S - L 0) L (i) ') 
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dan selanjutnya melakukan ekstraksi komponen utama terhadap 
matriks vj/ ( * +1) untuk mendapatkan Proses iterasi terus 

dilanjutkan hingga terpenuhi kriteria kekonvergenan tertentu. Matriks 
korelasi contoh R juga dapat digunakan untuk menggantikan S, namun 
perlu dicatat bahwa hasilnya belum tentu sama. 

Prosedur iteratif yang digambarkan di atas setara dengan 
meminimumkan 


fr[(S-S)2]=2X^-^) 2 

i j 


dengan kendala 


S = LL’ +m/ 

dalam dua tahap. Dengan demikian, metode faktor utama beriterasi 
ini setara dengan metode ULS kecuali pada metode ULS ada 
tambahan kendala yaitu matriks LL’ merupakan matriks diagonal. 


8.5. Kasus Heywood 

Dalam faktor analisis, tujuan utama yang dilakukan dapat 
digambarkan sebagai proses meminimumkan penyimpangan matriks 
ragam peragam (atau matriks korelasi) contoh S dengan matriks 

ragam-peragam S = LL’ + y, untuk mendapatkan L dan \j/ dengan 

kendala vj/ bersifat definit positif. Soulsi yang diperoleh akdang-kadang 
berupa solusi yang tak wajar, seperti misalkan diperoleh dugaan ragam 
khusus bernilai negatif. Kasus seperti ini dikenal dengan kasus 
Heywood. Secara definisi, kasus Heywood terjadi jika selama proses 

iterasi paling tidak diperoleh dugaan ragam khusus \j/ i bernilai negatif. 
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Karena \J/ i merupakan penduga ragam, maka dugaan seperti itu tidak 
layak, dan dengan demikian tidak dapat diterima. 

Kasus Heywood dapat terjadai pada praktek karena matriks Z = LL’ + vj/ 
mungkin bersifat definit positif meskipun ada satu atau lebih unsur vj/ 
yang bernilai o atau negatif. Hal ini dapat dilihat pada konsturksi 
matriks definit positif yang dikemukakan oleh Heywood (1931) berikut 
ini. 

Andaikan kita memilih /i, /2, ..., / P yang memenuhi konsisi /1 > 0, 0 < // < 1, / 
= 2, ..., p dan 


Z* < 1 + 


1 



+ ••• + 


/ 


2 

p 


l-l 


2 

p 


serta misalkan y/\, yn, ..., y/p diperoelh sehingga / 2 i + yn - 1, l 2 2 + ya - 1, 
.... / 2 P + y/p = 1. Maka matriks yang bentuknya 


y +y/ x 

ij 2 

y 1 

y 

. M 

yy 


1,1 

y 


p 

p 


ll + ¥ P 


bersifat definit positif. Perhatikan bahwa y /1 dapat bernilai < 0. 
Konstruksi matriks definit positif di atas berbeda dengan solusi analisis 
faktor karena ada salah satu y/, yaitu \ja yang bernilai < 0, sehingga 
didapatkan / 2 i > 1, sedangkan pada faktor analisis harus bernilai kurang 
dari 1. Sehingga kasus Heywood dapat menghasilkan solusi yang tak 
wajar. Namun perlu diperhatikan bahwa solusiyang tak wajar tidak 
selau berupa kasus Heywood. Menggunakan studi empiris, beberapa 
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penyebab yang dididentifikasi menimbulkan solusi tak wajar antara 
lain: 


ukuran contoh terlalu kecil 

banyaknya variabel terlalu sedikit 

terlalu banyak faktor bersama yang diekstraksi 

faktor bersama yang diekstraksi terlalu sedikit 

pendugaan awal komunalitas kurang tepat 

model faktor kurang tepat 

adanya pencilan 

Terjadinya solusi yang tak wajar tidak harus dipandang dari sisi 
negatifnya. Jika memungkinkan, penyebab dari kejadian ini harus 
diidentifikasi untuk selanjutnya dilakukan perbaikan. Hal-hal yang 
mungkin dapat memperbaiki solusi anatara lain adalah 

abaikan masalah ini jika penduganya tidak berbeda nyata 
dibandingkan solusi yang wajar 
buang peubah yang bermasalah 

perbaiki solusi tak wajar dengan nilai yang dapat diterima 
gunakan contoh yang lebih besar 
perbanyak peubah yang terlibat 

gunakan kendala pertidaksaman utnuk mencegak solusi tak wajar 
identifikasi dan buang data pencilan sebelum menerapakan 
analisis faktor. 

8.6. Rotasi Faktor 

Telah disinggung sebelumnya bahwa matriks loading faktor L yang 
diperoelh tergantung pada pemilihan matriks transformasi ortogonal r, 
dalam pengertian bahwa jika L adalah matriks loading faktor maka L* = 
L r juga merupakan matriks loadingfaktor asalkan r ortogonal. 
Ketidakunikan ini dapat menimbulkan kebingungan pada pengguna 
analisis faktor. Jika matriks loading faktor yang diperoleh sulit 
diinterpretasikan maka disarankan untuk mentransformasi matriks 
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tersebut dengan mengalikan matriks ortogonal terhadapnya sehingga 
interpretasi yang bermakna menggunakan matriks yang baru itu 
memungkinkan. Proses ini dikenal dengan sebutan rotasi daktor, 
karena dengan melakukan hal ini bukan faktor asal f yang digunakan 
melainkan faktor yang dirotasi f* = r f. 

Secara umum, rotasi faktor dilakukan sedemikian rupa sehingga faktor 
yang sudah dirotasi memiliki sedikit saja peubah dengan nilai mutlak 
loading yang besar, sedangkan sisanya kecil atau nol. Pola seperti ini 
akan memudahkan pengguna memberikan interpretasi terhadap 
faktor yang terbentuk. Sebagai teladan misalkan pada hasil analisis 
faktor didapatkan bahwa hanya tiga peubah pertama saja yang 
memiliki loading besar pada faktor bersama pertama. Maka faktor 
bersama tersebut dapat diinterpretasikan sebagai kombinasi linear 
hanya dari tiga peubah asal tadi. 

Dalam transformasi, beberapa literatur juga menyebutkan transformasi 
linear tak-ortogonal, atau dikenal juga sebagai rotasi oblique. 

8.6.1. Rotasi Ortogonal 

Beberapa metode untuk menentukan matriks ortogonal yang sesuai 
dilakukan dengan merotasi faktor telah diusulkan. Metode-metode itu 
mengoptimalkan fungsi tujuan tertentu untuk memperoleh matriks 
ortogonal. 

8.6.1. L Rotasi Quartimax 

Salah satu pendekatan yang terkenal adalah merancang matriks 
transformasi ortogonal sehinga ragam yang dihitung dari kuadrat 
loading faktor hasil transformasi mencapai maksimum. Yaitu, jika L 
adalah matriks loading faktor yang ingin ditranformasi mengunakan 
matriks ortogonal r menjadi L* = L r, maka r dipilih sehingga 
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4zzc - 4ZZ',; 2 = -^zz',; 4 - -^z*; 

P k ij yP k ij J P k i j \P k i 


(19) 


mencapai maksimum. Karena komunalitas h* 2 J* 2 = ^._ i l 2 = 

h 2 , i = 1,p seluruhnya adalah konstanta dan tidak tergantung pada 
transformasi r, maka memaksimumkan (19) sama saja dengan 
memaksimumkan unsur pertamanya saja yaitu L Z, C- 

Transformasi ortogonal denga tujugan memperoleh r yang 
memaksimumkan z, z /* 4 dikenal sebagai rotasi quartimax. 


8.6.I.2. Rotasi varimax kasar 

Kaiser (1958) mengusulkan bahwa ragam dari kuadrat loading yang 
berpadanan pada setiap kolom dihitung dan dijumlahkan, yaitu 
sebesar 


z 


7=1 


ii(0 2 - 

1 P 

-tv 

2 > 

p ,•=i 

t 



( 20 ) 


dimaksimumkan untuk mendapatkan matriks transformasi ortogonal r. 
Pendekatan menggunakan hal ini disebut rotasi varimax kasar. 


8.6.13. Rotasi varimax 


Prosedur varimax yang merupakan rotasi paling sering digunakan pada 
aplikasi merupakan transformasi ortogonal yang diperoleh dengan 
cara memaksimumkan 


176 











( 21 ) 


yang sebetulnya adalah versi pembakuan dari fungsi tujuan pada (20). 

8.6.1A Rotasi-rotasi lainnya 

Harman (1976) tertarik untuk memaksimumkan kmbinasi linear dari 
fungsi tujuan pada rotasi quartimax dan varimax kasar. Dia 
mengusulkan untuk memaksimumkan 



2 


( 22 ) 


dengan y adalah sebuah konstanta. Kriteria yang diberikan oleh (22) 
sangat umum, karena pemilihan y yang berbeda akan berimplikasi 
didapatkan transformasi ortogonal yang berbeda juga. Memilih y - 0 
sama saja dengan melakukan trnasformasi quartimax, y- 1 akan sama 
dengan rotasi varimax kasar, y- k/2 akan menghasilkan rotasi equimax 
(Saunders, 1962), dan y - p(k - 1 )/(p + k - 2) akan menghasilkan rotasi 
parsimax (Crawford, 1967). Rotasi equimax dan parsimax tidak kita 
diskusikan disini. 

8.6.2. Rotasi Oblique 

Kadangkala, bahkan setelah dilakukan transformasi ortogonal 
terhadap matriks loading faktor, faktor yang dihasilkan masih sulit untuk 
diinterpretasikan. Pada kasus seperti ini, rotasi oblique tertentu 
disarankan untuk dilakukan. Idenya adalah menemukan transformasi 
terhadap sumbu loading faktor asal sehingga sumbu hasil transformasi 
melalui kelompok loading faktor lebih dekat daripada yang dihasilkan 
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oleh transformasi ortogonal. Jadi, untuk matriks loading faktor tertentu L 
ingin diperoleh matriks T berukuran k x k, yang tidak harus matriks 
ortogonal sehingga matriks L* = LT memiliki interpretasi yang lebih 
bermakna daripada L. 

8.6.2.I. Rotasi H K 

Harris dan Kaiser (1964) menyatakan bahwa matriks T yang dicari dapat 
jadi merupakan fungsi dari beberapa matriks ortogonal dan matriks 
diagonal sederhana. Sebagai misal, matriks transformasi T mungkin 
berbentuk 


t - r 2 D 2 riDi 

dengan r 2 dan Ti adalah matriks ortogonal, serta Di dan D 2 adalah 
matriks diagonal. Salah saku kelompok rotasi oblique Harris-Kaisser 
adalah dengan mengambil r 2 = lk, sehingga 

T = D 2 riDi 

Dalam hal ini D 2 dan Ti dipilih terlebih dahulu, dan selanjutnya Di dipilih 
untuk melakukan penskalaan yang sesuai, sehingga matriks korelasi 
faktornya adalah O = Dr 1 rYD 2 - 1 riDi- 1 . Nantinya O adalah sedemikian 
sehingga matriks yang terpilih pada pemfaktoran dapat dinyatakan 
sebagai (LT) O(LT)’. Harris dan Kaiser meyarankan untuk pertama kali 
menggunakan metode faktor utama untuk mendapatkan L. Misalkan 
A adalah matriks diagonal dari akar ciri matriks korelasi semu yang 
digunakan pada metode faktor utama, maka pemilihan matriks D 2 dan 
Ti yang disarankan adalah D 2 = A~ 1/2 dan Ti adalah matriks transformasi 
quartimax. 

Jika menggunakan transformasi ortogonal L* = L r mempertahankan 
sifat bahwa antaf faktor tidak berkorelasi, namun trnasformasi oblique 
L* = LT menyebabkan adanya korelasi antar faktor. Matriks korelasi 
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antar faktor adalah (T’T)' 1 Jika yang digunakan sebagai matriks yang 
diekstraksi adalah matriks korelasi maka korelasi antara peubah asal 
dengan faktor bersama, tidak lain adalah L. Namun jika digunakan 
rotasi oblique L* = LT, maka matriks korelasinya adalah L(T’)- 1 . Nilai 
korelasi ini berguna untuk studi lebih mendalam pada pemilihan faktor, 
namun matriks pola faktor yang terotasi yang seharusnya digunakan 
untuk interpretasi faktor. 

8.6.22. Rotasi Promax 

Transformasi oblique lainyya adalah rotasi promox yang dikemukakan 
oleh Hendrickson dan White (1964). Mereka mengasumsikan bahwa 
struktur sederhana untuk loading faktor yang dihasilkan transformasi 
ortogonal mirip dengan struktru sederhana yang dihasilkan rotasi 
oblique. Sehingga mereka memulai dengan matriks loading faktor hasil 
transformasi ortogonal. Transformasi ortogonal yang biasa digunakan 
adalah varimax. Sehingga diskusi rotasi faktor berikut ini diasumsikan 
menggunakan varimax. 

Misalkan L* = L r adalah loading faktor yang ditransformasi varimax. 
Disusun dulu matirks Q = (q,y) berukuran p x k dan disebut sebagai 
matriks target, yang diasumsikan memiliki struktur sederhana 

q»-i i*!?"', 

dengan m adalah bilangan asli lebih dari 1. Sehingga q,y memiliki tanda 
yang sama dengan l*. dan |q,y| = | l*. |. 

Alasan mengambil nilai q,y melalui pemangkatan /.* dengan m adalah 

untuk mengupayakan unsur-unsurnya memiliki nilai yang lebih kecil dan 
mendekati nol dengan cepat. Hendrickson dan White 
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merekomendasikan matriks target Q didekati dengan transformasi 
oblique terhadap L*. Rotasi promax diberikan oleh matriks 

T = U {d/ag(U’U)‘ 1/2 } 

dengan U adalah matriks berukuran k x k, U = (ui | U 2 | ... | Uk), dan 
kolom ke-/ matriks U yaitu u/ diperoleh dengan meminimumkan bentuk 
kuadratik 


(q/ - L*u/)' (q/ - L*Uj) 

terhadap u j,j =1,2, ..., k. Vektor q/ adalah kolom ke-/ dari matriks target 
Q. Solusi dari k buah permasalahan minimisasi di atas dapat 
dinyatakan bersama sebagai 


U = (L*’L*)- 1 L*’Q. 

8.7. Menduga Skor Faktor 

Prediksi atau dugaan nilai faktor bersama yang berpadanan dengan 
pengamatan dengan nilai peubah asal tertentu disebut sebagai skor 
faktor untuk pengamatan tersebut. Nilai-nilai ini dapat digunakan 
sebagai data yang telah tereduksi untuk analisis statistik lanjutan. 
Misalkan, nilai tersebut sering digunakan untuk tujuan diagnostik. Nilai 
sekor dihitung setelah model faktor yang sesuai telah ditentukan. 
Artinya, setelah dugaan matriks loading faktor diperoleh dan rotasi 
yang sesuai dilakukan, baru ditentukan skor faktor untuk setiap objek 
(individu). 


Kami menyajikan dua metodeuntuk memprediksi skor faktor. Keduanya 
mengasumsikan bahwa data mentah (nilai peubah asal) tersedia 
sehingga skor faktor dapat dihitung. 
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8.7.1. Metode Kuadrat Terkecil Terboboti (Weighted 
Least Squares Method ) 

Metode ini menentukan nilai skor faktor yang berpadanan dengan 
pengamatan x/, / = 1, ..., n didapatkan menggunakan formula kuadrat 
kecil terboboti 


f, = -x' 

dimana x merupakan vektor rataan contoh dari data. Penduga L 
dan \j/ diperoleh menggunakan metode kemungkinan maksimum. Jika 

matriks korelasi yang digunakan (atau peubah asal telah dibakukan 
terlebih dahulu) untuk analisis faktor, maka 



digunanan menggantikan — x pada formula skor faktor di atas. 

8.7.2. Metode Regresi 

Metode ini menduga skor faktor untuk pengamatan yang berpadanan 
dengan x, menggunakan formula yang sama dengan formula koefisien 
regresi linear, yaitu 


f z . = L'S 1 (x j — x) , / — 1.n 
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Jika matriks korelasi yang digunakan untuk ekstraksi faktor maka 
digunakan z/ seperti yang didefinisikan pada bagian sebelumnya untuk 

menggantikan — X , serta R menggantikan posisi S. 

8.8. Aplikasi SAS 

Prosedur SAS yang digunakan untuk analisis factor adalah PROC 
FACTOR. 

PROC FACTOR menyediakan berbagai metode untuk ekstraksi dan 
rotasi. Bentuk umum dari perintah PROC FACTOR adalah: 

PROC FACTOR <options> ; 

VAR voriables ; 

PRIORS communalities ; 


RUN; 

Ada tiga metode utama yang banyak digunakan dalam 
mendapatkan skor faktor, yaitu: Metode Kemungkinan Maksimum 
(rmaximum likelihood). Metode Kuadrat Terkecil Tak-Terboboti 
(unweighted least squares), dan Metode Komponen Utama. Dalam 
PROC FACTOR ketiganya dilakukan dengan cara memberikan perintah 
METHOD=opsi. Opsi yang dimaskud adalah sesuai dengan metodenya, 
yaitu ML, ULS dan PRIN. 

Untuk pendugaan komunalitas, ada beberapa metode yang sering 
digunakan dan tersedia di PROC FACTOR. Dua metode yang paling 
sering digunakan , yaitu berdasarkan pada korelasi berganda kuadrat 
antar tiap peubah yang diamati dengan peubah teramati lainnya, 
atau berdasarkan korelasi maksimum antara tiap peubah teramati 
dengan peubah teramati lainnya. Metode yang umum dipakai adalah 
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yang berdasarkan kuadrat dari korelasi berganda (squared multiple 
correlation, SMC). 


Berikut adalah ilustrasi penggunaan SAS untuk analisis factor. 


Data yang digunakan adalah data tentang tingkat sakit yang 
dirasakan oleh 121 pasien yang mengeluhkan sakit di bagian muka 
dan rahang. Pasien-pasien tersebut disinyalir menderita gejala yang 
dinamakan Painful Temporomandibular Disorder atau TMD. Peubah 
yang diukur dari pasien tersebut didasarkan pada pertanyaan berikut: 

1. apakah anda sakit saat mengunyah ? -> HURTCHEW 

2. apakah anda sakit saat membuka mulut ? -> HURTWIDE 

3. apakah rahang anda berisik ? -> NOISE 

4. apakah anda memiliki keluhan sakit di bagia telinga atau 
telinga bagian luar ? -> EARPAIN 

5. apakah anda punya keluahan sakit di bagian muka, rahang, 
mata, tenggorokan, leher ? -> FACEPAIN 

6. apakah sakit yang anda derita mengganggu tidur anda ? -> 
PAINSLP 

7. apakah sakit yang anda derita mengganggu kegiatan rutin 
anda ? -> PAINROUT 

8. apakah anda mengkonsumsi obat-obat penghilang rasa sakit 
? ^ PAINTAB 

9. apakah teman anda mengatakan bahwa gigi anda bergertak 
saat tidur ? -> GRIND 

10. apakah anda sadar bahwa anda sering bertopang dagu ? -> 
CLAMPSET 

11. apakah rahang anda kaku ketika bangun tidur ? -> STIFFJAW 

12. apakah rahang atau gigi anda sakit ketika bangun tidur ? -> 
SOREJAW 

13. apakah anda sakit kepala ketika bangun tidur ? -> AMHDACHE 

14. apakah rahang anda sulit digerakkan di ketika bangun tidur ? 
^ CRACKING 
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Data yang didapatkan telah dituliskan dalam SAS sebagai berikut. 


data 

contoh; 













input 

isub hurtchew hurtwide noise stiffjaw cracking 



painslp painrout paintab 

amhdache 

earpain grind 



clampset 

sorejaw facepain dayslost ; 



cards ; 
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Untuk kasus nyata dalam melakukan analisis data tersebut, diperlukan 
tahapan eksplorasi secara lengkap termasuk pembuatan plot, korelasi 
dan statistika deskriptif. Namun pada modul ini tahapan tersebut 
dipersingkat dengan hanya menampilkan korelasinya saja. 
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proc corr 

data=contoh 

nosimple noprob 



var hurtchew-- 

facepain; 



run; 


The CORR 

Procedure 


14 Variables: hurtchew hurtwide noise stiffjaw cracking 


painslp painrout paintab amhdache earpain grind 


clampset sorejaw facepain 



hurtchew 

hurtwide 

noise stiffjaw cracking 

hurtchew 

1.00000 

0.91857 

0.73954 

0.83351 0.74672 

hurtwide 

0.91857 

1.00000 

0.75415 

0.84741 0.70225 

noise 

0.73954 

0.75415 

1.00000 

0.74195 0.59856 

stiffj aw 

0.83351 

0.84741 

0.74195 

1.00000 0.67549 

cracking 

0.74672 

0.70225 

0.59856 

0.67549 1.00000 

painslp 

0.06011 

0.04377 

0.09455 

-0.02320 0.07515 

painrout 

0.04807 

0.00032 

0.07731 

-0.05749 0.07234 

paintab 

0.10696 

0.08191 

0.11993 

0.01156 0.18199 

amhdache 

0.01362 

-0.00149 

0.06352 

-0.06753 0.03717 

earpain 

0.14590 

0.09182 

0.09979 

0.10905 0.15655 

grind 

0.19999 

0.15790 

0.16047 

0.14768 0.22304 

clampset 

0.18743 

0.13108 

0.14257 

0.10542 0.12748 


painslp 

painrout 

paintab 

amhdache earpain 

hurtchew 

0.06011 

0.04807 

0.10696 

0.01362 0.14590 

hurtwide 

0.04377 

0.00032 

0.08191 

-0.00149 0.09182 

noise 

0.09455 

0.07731 

0.11993 

0.06352 0.09979 

stiffj aw 

-0.02320 

-0.05749 

0.01156 

-0.06753 0.10905 

cracking 

0.07515 

0.07234 

0.18199 

0.03717 0.15655 

painslp 

1.00000 

0.75940 

0.78605 

0.86336 0.16670 

painrout 

0.75940 

1.00000 

0.68056 

0.74152 0.12608 

paintab 

0.78605 

0.68056 

1.00000 

0.75483 0.14265 

amhdache 

0.86336 

0.74152 

0.75483 

1.00000 0.13100 

earpain 

0.16670 

0.12608 

0.14265 

0.13100 1.00000 

grind 

0.06644 

0.14109 

0.08491 

0.04135 0.72987 

clampset 

0.19254 

0.13345 

0.13146 

0.12323 0.76628 


grind 

clampset 

sorejaw 

facepain 

hurtchew 

0.19999 

0.18743 

0.09069 

0.34282 

hurtwide 

0.15790 

0.13108 

0.03075 

0.35609 

noise 

0.16047 

0.14257 

0.01782 

0.27994 

stiffj aw 

0.14768 

0.10542 

0.04959 

0.22439 

cracking 

0.22304 

0.12748 

0.12789 

0.17662 

painslp 

0.06644 

0.19254 

0.15206 

0.34902 

painrout 

0.14109 

0.13345 

0.10004 

0.19799 

paintab 

0.08491 

0.13146 

0.16825 

0.29645 

amhdache 

0.04135 

0.12323 

0.15453 

0.28534 

earpain 

0.72987 

0.76628 

0.76465 

0.09168 

grind 

1.00000 

0.69432 

0.67947 

0.14377 

clampset 

0.69432 

1.00000 

0.65412 

0.17727 


Bila Anda perhatikan hasil korelasi tersebut akan didapati beberapa 
peubah yang memiliki korelasi yang sangat besar. Hal itu terlihat jelas 
karena peubah-peubah tersebut diatur sedemikian rupa sehingga 
variabel yang berkorelasi cukup besar terletak berdampingan. 

Dengan demikian tidak salah jika dari peubah-peubah yang berkorelasi 
tinggi tersebut, ada peubah-peubah laten atau faktor yang 
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mendasarinya. Analisis faktor akan digunakan untuk mendapatkan 
faktor yang dimaksud. 

Untuk kasus di atas, perintah yang digunakan adalah 


proc factor data=contoh method=ML rotate=VARIMAX nocorr 
scree ; 

var hurtchew--facepain ; 
priors SMC; 

run; 


Penjelasan dari opsi-opsi yang dipakai pada contoh program di atas 


METHOD = ML 

menyebutkan penggunaan metode 

kemungkinan maksimum dalam ekstraksi 

NOCORR 

tidak menampilkan matriks korelasi antar 
peubah teramati 

SCREE 

menampilkan scree plot, yaitu plot yang 
menjelaskan hubungan antara nilai akar ciri 
dengan banyaknya faktor 

ROTATE = VARIMAX 

menyebutkan metode rotasi faktor 

menggunakan VARIMAX 

PRIORS = SMC 

menyebutkan metode menentukan komunal 
menggunakan SMC 


Dalam program di atas, kita tidak menyebutkan berapa faktor yang 
digunakan, sehingga SAS secara default akan menentukan, dan dari 
hasil didapatkan sebanyak 3 faktor. 

Dugaan awal komunalitas dilakukan dengan metode SMC antar 
peubah teramati, hasilnya adalah sebagai berikut. 
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The FACTOR 

Procedure 



Initial 

Factor Method: 

: Maximum Likelihood 


Prior Communality 

Estimates: SMC 


hurtchew 

hurtwide 

noise 

stiffj aw 

cracking 

0.87838943 

0.87757657 

0.62831100 

0.77519365 

0.61159069 

painslp 

painrout 

paintab 

amhdache 

earpain 

0.82284339 

0.65700913 

0.67282808 

0.78178793 

0.73791420 


grind 

clampset 

sorej aw 

facepain 

| 0.65023704 0 

.65812762 

0.65210136 

0.30773023 


Selanjutnya, Anda akan mendapati akar ciri dari matriks korelasi yang 
tereduksi. Nilai-nilai tersebut diinterpretasikan sebagai ragam dari faktor 
yang berpadanan dengannya. Beberapa diantaranya bernilai negatif, 
yang merupakan ragam dari faktor yang imaginer. 


Preliminary Eigenvalues: Total = 42. 

2227014 Average = 3.01590724 


Eigenvalue 

Difference 

Proportion 

Cumulative 

1 

22.1866011 

8.8566626 

0.5255 

0.5255 

2 

13.3299385 

5.4335408 

0.3157 

0.8412 

3 

7.8963977 

7.3961789 

0.1870 

1.0282 

4 

0.5002189 

0.2362913 

0.0118 

1.0400 

5 

0.2639276 

0.0650434 

0.0063 

1.0463 

6 

0.1988841 

0.1909592 

0.0047 

1.0510 

7 

0.0079249 

0.0792444 

0.0002 

1.0512 

8 

-0.0713195 

0.1620991 

-0.0017 

1.0495 

9 

-0.2334186 

0.0273054 

-0.0055 

1.0440 

10 

-0.2607240 

0.0411412 

-0.0062 

1.0378 

11 

-0.3018652 

0.0570478 

-0.0071 

1.0306 

12 

-0.3589130 

0.0828409 

-0.0085 

1.0221 

13 

-0.4417539 

0.0514436 

-0.0105 

1.0117 

14 

-0.4931974 


-0.0117 

1.0000 

3 

factors will be 

retained by the 

PROPORTION 

criterion. 


Kriteria default jika menggunakan METHOD=ML adalah mengambil 
faktor sehingga persentase keragaman yang dijelaskan mencapai 
100%. Dalam contoh di atas, terlihat bahwa dengan menggunakan 3 
faktor telah tercapai kumulatif sebesar 1.00. 


Dengan berdasarkan scree plot juga dapat dilihat bahwa tiga akar ciri 
pertama jauh lebh besar daripada akar ciri sisanya, yang 
menerangkan bahwa faktor sisanya memeilki kontribusi yang jauh lebih 
kecil. 


The FACTOR Procedure 
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Initial Factor Method: Maximum Likelihood 


Scree Plot of Eigenvalues 
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Number 


Metode kemungkinan maksimum menggunakan prosedur optimasi 
non-linear secara iteratif. Pada contoh ini diperlukan tiga iterasi untuk 
mencapi kekonvergenan. 
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The SAS System 





The FACTOR Procedure 




Initial 

Factor Method: Maximum Likelihood 


Iteration 

Criterion 

Ridge Change 

Communalities 


1 

0.4720449 

0.0000 0.0967 

0.91413 

0.91818 

0.63165 




0.78954 

0.57923 

0.89442 




0.64866 

0.69852 

0.83648 




0.83458 

0.68004 

0.68794 




0.68317 

0.21737 


2 

0.4712085 

0.0000 0.0081 

0.91491 

0.92098 

0.62716 




0.78520 

0.57855 

0.89474 




0.64929 

0.69613 

0.83615 




0.83603 

0.67300 

0.69218 




0.68715 

0.22544 


3 

0.4711972 

0.0000 0.0009 

0.91533 

0.92095 

0.62668 




0.78494 

0.57798 

0.89481 




0.64923 

0.69610 

0.83611 




0.83692 

0.67288 

0.69165 




0.68669 

0.22587 


Convergence criterion 

satisfied. 





Terdapat uji awal berupa uji nisbah kemungkinan untuk mengevaluasi 
seberapa bagus jumlah faktor sebayak tiga yang terpilih tadi. Dalam 
hal ini bisa dilakukan pengujian terhadap hipotesis nol tentang tidak 
ada faktor, atau bisa juga diuji hipotesis nol yang berupa tidak 
dibutuhkan lagi lebih banyak faktor. Pada contoh ini, kita tolah 
hipotesis nol yang pertama, dan kita terima hipotesis nol yang kedua. 

I * Significance Tests Based on 121 Observations 



Test 

DF 

Chi-Square 

Pr > 
ChiSq 

H0: 

HA: 

No common factors 

At least one common factor 

91 

1356.7888 

<.0001 

H0: 

HA: 

3 Factors are sufficient 

More factors are needed 

52 

53.0097 

0.4350 


Chi-Square without Bartlett's Correction 56.54367 
Akaike's Information Criterion -47.45633 
Schwarz's Bayesian Criterion -192.83744 
Tucker and Lewis's Reliability Coefficient 0.99860 


Berikut adalah ouput dari analisis faktor yang belum dirotasi. Namun, 
untuk interpretasi akan digunakan hasil setelah dirotasi. 


Squared Canonical Correlations 

Factorl Factor2 Factor3 

0.96766451 0.94865487 0.91245558 

Eigenvalues of the Weighted Reduced Correlation 
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Matrix: Total 


58.8245826 


4.2017559 



Eigenvalue 

Difference 

Proportion 

Cumulative 

1 

29.9257685 

11.4497265 

0.5087 

0.5087 

2 

18.4760420 

8.0532689 

0.3141 

0.8228 

3 

10.4227732 

9.9002273 

0.1772 

1.0000 

4 

0.5225458 

0.1755004 

0.0089 

1.0089 

5 

0.3470454 

0.0329634 

0.0059 

1.0148 

6 

0.3140820 

0.1781226 

0.0053 

1.0201 

7 

0.1359594 

0.0777242 

0.0023 

1.0224 

8 

0.0582352 

0.1223935 

0.0010 

1.0234 

9 

-0.0641583 

0.0469919 

-0.0011 

1.0223 

10 

-0.1111502 

0.0885464 

-0.0019 

1.0204 

11 

-0.1996966 

0.0414323 

-0.0034 

1.0170 

12 

-0.2411290 

0.0959318 

-0.0041 

1.0129 

13 

-0.3370608 

0.0876132 

-0.0057 

1.0072 

14 

-0.4246740 


-0.0072 

1.0000 



Factorl 

Factor2 

Factor3 

hurtchew 

0.94910 

-0.11071 

-0.04773 

hurtwide 

0.94297 

-0.14657 

-0.10148 

noise 

0.78511 

-0.05376 

-0.08561 

stiffj aw 

0.86188 

-0.19845 

-0.05177 

cracking 

0.75905 

-0.04229 

-0.01028 

painslp 

0.16230 

0.90769 

-0.21114 

painrout 

0.11640 

0.77729 

-0.17748 

paintab 

0.19416 

0.78821 

-0.19268 

amhdache 

0.10793 

0.87939 

-0.22613 

earpain 

0.23652 

0.32783 

0.82067 

grind 

0.27884 

0.21407 

0.74109 

clampset 

0.26239 

0.31251 

0.72470 

sorej aw 

0.16759 

0.32315 

0.74447 

facepain 

0.38357 

0.27465 

-0.05768 


Variance Explained by Each Factor 


Factor 

Factorl 

Factor2 

Factor3 


Weighted 

29.9257685 

18.4760420 

10.4227732 


Unweighted 

4.19235839 

3.33128063 

2.49250606 


Final Communality Estimates and Variable Weights 

Total Communality: Weighted = 58.824584 Unweighted = 10.016145 


Variable 

Communality 

Weight 

hurtchew 

0.91532762 

11.8099537 

hurtwide 

0.92096839 

12.6510054 

noise 

0.62661878 

2.6786820 

stiffj aw 

0.78489781 

4.6498962 

cracking 

0.57804504 

2.3695735 

painslp 

0.89481246 

9.5067471 

painrout 

0.64922382 

2.8508558 

paintab 

0.69609785 

3.2905561 

amhdache 

0.83610851 

6.1016255 

earpain 

0.83691756 

6.1321039 

grind 

0.67278898 

3.0569829 

clampset 

0.69170415 

3.2430928 

sorej aw 

0.68674643 

3.1917282 

facepain 

0.22588769 

1.2917796 




Berikut adalah hasil rotasi. Yang ingin dievaluasi adalah ROTATED 
FACTOR PATTERN. Secara umum, ada dua jenis matriks yang 
menggambarkan hubungan antara peubah laten (faktor) dan peubah 
teramati: 

matriks FACTOR PATTERN, berisi koefisien untuk menyusun 
peuabh teramati dari peubah faktor 

matriks FACTOR STRUCTURE, berisi korelasi antara faktor dengan 
peubah teramati. 

Setelah mengalami rotasi, kedua matriks diatas identik. 



Rotated 

Factor Pattern 



Factorl 

Factor2 

Factor3 

hurtchew 

0.95158 

0.03084 

0.09422 

hurtwide 

0.95904 

0.01259 

0.03239 

noise 

0.78672 

0.07526 

0.04504 

stiffj aw 

0.88236 

-0.06184 

0.05018 

cracking 

0.74922 

0.05982 

0.11462 

painslp 

0.02799 

0.94176 

0.08435 

painrout 

0.00150 

0.80258 

0.07133 

paintab 

0.07747 

0.82742 

0.07400 

amhdache 

-0.01810 

0.91270 

0.05254 

earpain 

0.06377 

0.08949 

0.90821 

grind 

0.13556 

0.01174 

0.80887 

clampset 

0.10451 

0.10757 

0.81805 

sorej aw 

0.00754 

0.09952 

0.82267 

facepain 

0.33392 

0.32564 

0.09137 


Penjelasan dari setiap faktor adalah sebagai berikut: 

Faktor 1, menerangkan peubah-peubah yang berhubungan 
dengan pergerakan rahang 

Faktor 2, menerangkan peubah-peubah yang berhubungan 

dengan keluhan-keluhan yang diderita 

Faktor 3, menerangkan tentang rasa sakit di gigi dan rahang 


Peubah terakhir, yaitu FACEPAIN berhubungan cukup erat dengan dua 
faktor pertama. _ 


Variance Explained 

by Each Factor 

Factor 

Weighted 

Unweighted 

Factorl 

29.2279839 

3.93610681 

Factor2 

17.9138690 

3.19852482 

Factor3 

11.6827308 

2.88151346 

Final Communality 

Estimates and Variable Weights 

Total Communality: Weighted 

= 58.824584 

Unweighted = 10.016145 

Variable 

Communality 

Weight 
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8.9. Latihan 


1. Berikut adalah data panjang tulang ramus pada empat 
kelompok umur dari 20 anak laki-laki. 


Individu 


Umur (Tahun) 


8 

(Vl) 

8 3 

(y:) 

9 

(y.v) 

9y 

(V4) 

i 

47.8 

48.8 

49.0 

49.7 

2 

46.4 

47.3 

47.7 

48.4 

3 

46.3 

46.8 

47.8 

48.5 

4 

45.1 

45.3 

46.1 

47.2 

5 

47.6 

48.5 

48.9 

49.3 

6 

52.5 

53.2 

53.3 

5.3.7 

7 

51.2 

53.0 

54.3 

54.5 

8 

49.8 

50.0 

50.3 

52.7 

9 

48.1 

50.8 

52.3 

54.4 

10 

45.0 

47.0 

47.3 

48.3 

11 

51.2 

51.4 

51.6 

51.9 

12 

48.5 

49.2 

53.0 

55.5 

13 

52.1 

52.8 

53.7 

55.0 

14 

48.2 

48.9 

49.3 

49.8 

15 

49.6 

50.4 

51.2 

51.8 

16 

50.7 

51.7 

52.7 

53.3 

17 

47.2 

47.7 

48.4 

49.5 

18 

53.3 

54.6 

55.1 

55.3 

19 

46.2 

47.5 

48.1 

48.4 

20 

46.3 

47.6 

51.3 

51.8 


Lakukan analisis faktor dengan metode komponen utama. 
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9 


9.alisis Gerombol (Cluster Analysis ) 


9.1. Pendahuluan 

Analisis gerombol merupakan teknik peubah ganda yang mempunyai 
tujuan utama untuk mengelompokkan objek-objek berdasarkan 
kemiripan karakteristik yang dimilikinya. Karakteristik objek-objek dalam 
suatu gerombol memiliki tingkat kemiripan yang tinggi, sedangkan 
karakteristik antar objek pada suatu gerombol dengan gerombol lain 
memiliki tingkat kemiripan yang rendah. Dengan kata lain, keragaman 
dalam suatu gerombol minimum sedangkan antar keragaman antar 
gerombol maksimum. 

Variabel-variabel yang dilibatkan dalam analisis gerombol dipilih sesuai 
dengan tujuan penggerombolan. Misalnya dalam suatu kajian ingin 
dibentuk gerombol objek berdasarkan kemampuan prestasi akademik. 
Variabel-variabel yang relevan dimasukan dalam kajian ini antara lain 
nilai rapor setiap mata pelajaran yang diambil dan nilai ujian nasional. 
Berbeda dengan teknik multivariat lainnya, analisis ini tidak memilih gugus 
variabel secara empiris tetapi menggunakan gugus variabel yang 
ditentukan oleh peneliti itu sendiri sesuai dengan tujuan penggerombolan. 


Kemiripan antar objek diukur dengan menggunakan ukuran jarak. 
Beberapa ukuran jarak yang sering digunakan antara lain jarak Euclid, 
jarak mahalanobis, jarak City-block (Manhattan), dan lain-lain. 
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1. Jarak Euclidean 


Ini merupakan tipe jarak yang paling umum dipilih. Kemudahannya 
adalah jarak geometrik dalam ruang dimensi ganda. 
Perhitungannya sebagai berikut: 

Jarak (x,y)={i(xi-yi)2}l/2 . 

Perhatikan bahwa jarak Euclidean (dan kuadrat Euclidean) biasanya 
dihitung dari data mentah, dan tidak dari data standar. Metode ini 
memiliki beberapa keuntungan, antara lain jarak dari 2 objek apa 
saja tidak dipengaruhi oleh penambahan dari objek baru untuk di 
analisis, yang mungkin merupakan pencilan. Namun demikian, jarak 
bisa menjadi sangat besar, disebabkan hanya karena perbedaan 
skala. Sebagai contoh, jika suatu dimensi di ukur dalam satuan jarak 
cm, dan dikonversi dalam mm (dengan mengkalikan nilai dengan 10), 
hasil dari jarak Euklidean atau kuadrat Euklidean ( dihitung dari 
dimensi ganda) bisa sangat berbeda, dan konsekuensinya, hasil dari 
analisis kluster mungkin menjadi berbeda. 

2. Jarak Kuadrat Euclidean 

Mungkin kita ingin mengkuadratkan jarak Euclidean standar untuk 
menempatkan bobot yang lebih besar secara progresif pada objek 
yang jaraknya jauh. Jarak ini perhitungannya sbb: 

jarak ( x.y)=Ei(xi-yi) 2 . 

3. Jarak City-BIock (Manhattan) 

Jarak ini memudahkan jarak rata-rata dimensi-dimensi secara 
menyilang. Dalam banyak kasus, ukuran jarak ini mendapatkan hasil 
yang mirip terhadap jarak Euklidean sederhana. Bagaimanapun, 
perhatikan bahwa dalam ukuran ini, efek dari perbedaan besar yang 
tunggal (pencilan) dibuang, karena tidak dikuadratkan. 


197 



arak City-BIock ditulis sbb: 

jarak (x / y)= Ei | xi - yi | 

4. Jarak Chebychev 

Ukuran jarak ini mungkin cocok untuk kasus menentukan 2 objek, 
sebagai “Berbeda” jika mereka berbeda terhadap segala sesuatu 
pada dimensi. Jarak Chebychev dihitung sbb : 

jarak (x,y) = maksimum | xi- yi | 

5. Jarak Kuasa 

Untuk meningkatkan atau menurunkan bobot progresiv yang 
ditempatkan pada dimensi yang respektif terhadap objek yang 
berbeda bisa dipenuhi oleh jarak kuasa. Jarak kuasa dihitung sbb: 

jarak (x,y)=(Zi|Xi-Y i |p) 1 / r 

Dimana r dan p adalah parameter yang ditentukan. Beberapa 
contoh penghitungan akan didemonstrasikan, bagaimana ini 
mengukur “perilaku”. Parameter p mengontrol bobot progresiv yang 
ditempatkan pada perbedaan di dimensi individu, parameter r 
mengontrol bobot progresiv yang ditempatkan pada perbedaan 
yang lebih besar antara objek . jika r dan p bernilai 2, maka jarak ini 
sama dengan jarak Euklidean. 

9.2. Metode Penggerombolan 

Terdapat tiga metode yang umum digunakan dalam penggerombolan 
objek yaitu metode grafik, metode berhirarki dan metode tak berhirarki. 

9.2.1. Metode Grafik 

Metode grafik, terdiri atas tiga jenis yaitu plot profil, plot Andrew dan plot 
Andrew termodifikasi. Pendekatan grafik yang paling sederhana adalah 
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menggunakan plot profil dari setiap pengamatan. Plot ini hanya efektif 
untuk data yang tidak terlalu banyak pengamatannya, sehingga 
pembakuan data sangat membantu dalam proses ini. 

Plot lain yang bias digunakan adalah plot Andrew dan plot Andrew 
termodifikasi. Kedua plot ini memberikan hasil yang lebih efektif dalam 

penggerombolan objek. Untuk vector pengamatan x = (x lf x 2 , ...x p ) , 
fungsi Andrew dan dan fungsi Andrew termodifikasi berturut - turut 
didefinisikan sebagai berikut: 

f x t = ^=x 1 + x 2 sin(t) + x 3 cos(t) + x 4 sin(21) + x 5 cos(21) + ••• —n < t <n 


dan 

g x t — J=[*i + x 2 [sin(t) + cos(t)] + x 3 [sin(t) — cos(t)] + x 4 [sin(2t) + cos(2t)] + 
x s [sin(2t) - cos(2t)] H— ] —n < t < n 

Ketiga metode ini sama - sama menggambarkan karakteristik tiap 
gerombol. Titik bertanya pada karakteristik yang secara signifikan 
berbeda antar gerombol dan memprediksi anggota dalam suatu 
gerombol khusus. 

9.2.2. Metode Penggerombolan Berhierarkhi 

Metode ini digunakan untuk menggerombolkan pengamatan secara 
terstuktur berdasarkan kemiripan sifatnya dan gerombol yang diinginkan 
belum diketahui banyaknya. Ada dua cara untuk mendapatkan 
gerombol dengan metode penggerombolan hirarki yaitu dengan cara 
penggabungan ( aglomerative ) dan pemisahan gerombol (dev/s/Ve). 
Metode hirarki dengan cara penggabungan didapat dengan 
menggabungkan pengamatan atau gerombol secara bertahap, 
sehingga pada akhirnya didapat hanya satu gerombol saja. Sebaliknya 
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cara pemisahan pada metode hirarki dimulai dengan membentuk satu 
gerombol besar beranggotakan seluruh pengamatan. Gerombol besar 
tersebut kemudian dipisah menjadi gerombol yang lebih kecil, sampai 
satu gerombol hanya beranggotakan satu pengamatan saja. Kedua 
cara dalam metode hirarki ini tidak berbeda dalam pembentukan 
gerombol yang terjadi tetapi hanya berbeda dalam tahapan 
pembentukan gerombol saja. 


9.Z2.L Keterhubungan Tunggal (Single Linkage/Nearest 
Neighbor) 

Metode Single Linkoge atau disebut juga dengan motode pautan 
tunggal, jarak antara dua cluster (kelompok) dapat ditentukan dari dua 
obyek berpasangan yang memiliki kesamaan atau memiliki jarak terdekat 
(nearest neighbor ) dalam cluster yang berbeda. Hal ini berlaku jika 
pengelompokan itu mempunyai makna atau tujuan yang jelas, 
terdapatnya kumpulan-kumpulan obyek yang bersama-sama 
membentuk cluster serta kecenderungan dari hasil pengelompokan itu 
menggambarkan rantai “chain” yang panjang. 

Pertama kali yang harus dilakukan untuk mendapatkan pautan tunggal ini 
adalah harus menemukan jarak terdekat antar cluster-cluster tersebut, 
dirumuskan dengan D ={dik}. Kemudian menggabungkan obyek-obyek 
yang sesuai, misalkan obyek tersebut dilambangkan dengan cluster U dan 
cluster V untuk mendapatkan cluster gabungan (UV). 

Untuk menghitung jarak cluster (UV) dengan cluster-cluster yang lain 
dapat dirumuskan dengan : 

d(uv)w = min {duw,dvw} 

Catatan: nilai duw dan dvw menggambarkan jarak terdekat antara cluster 
U dengan W serta V dengan W. Hasil dari single linkage clustering ini 
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dapat ditampilkan dalam bentuk dendogram atau diagram pohon, 
dimana dahan atau cabang dari diagram pohon tersebut 
menggambarkan clusternya. 

9 . 22 . 2 . Keterhubungan menyeluruh (Complete Linkage / 
Furthest Neighbor) 

Jarak antar cluster pada metode Complete Linkage atau disebut juga 
metode pautan lengkap, ditentukan dari jarak terjauh antara dua obyek 
pada cluster yang berbeda (furthest neighbor). Metode ini dapat 
digunakan dengan baik untuk kasus dimana obyek-obyek yang ada 
berasal dari kelompok yang benar-benar berbeda. 

Langkah pertama yang harus dilakukan adalah sama seperti kasus single 
linkage yaitu harus menemukan jarak terdekat antar cluster-cluster 
tersebut, dirumuskan dengan D ={dik}. Kemudian menggabungkan 
obyek-obyek yang sesuai, misalkan obyek tersebut dilambangkan 
dengan cluster U dan cluster V untuk mendapatkan cluster gabungan 
(UV). 

Untuk menghitung jarak cluster (UV) dengan cluster-cluster yang lain 
dapat dirumuskan dengan : 

d(uv)w = max {duw,dvw} 

Catatan: nilai duw dan dvw menggambarkan jarak terjauh antara cluster U 
dengan W serta V dengan W. 

922 . 3 . Keterhubungan Rataan (Average Linkage) 

Jarak antar cluster pada metode Average Linkage atau disebut juga 
metode pautan rataan, ditentukan dari rata-rata jarak seluruh objek suatu 
cluster terhadap seluruh objek pada cluster lainnya. Pada berbagai 
keadaan, metode ini dianggap lebih stabil dibandingkan dengan kedua 
metode di atas. 
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Langkah pertama yang harus dilakukan adalah sama seperti kasus single 
atau complete linkage yaitu harus menemukan jarak terdekat antar 
cluster-cluster tersebut, dirumuskan dengan D ={dik}. Kemudian 
menggabungkan obyek-obyek yang sesuai, misalkan obyek tersebut 
dilambangkan dengan cluster U dan cluster V untuk mendapatkan cluster 
gabungan (UV). 

Untuk menghitung jarak cluster (UV) dengan cluster-cluster yang lain 
dapat dirumuskan dengan : 

d(uv)w = rata-rata {duw,dvw} 

Catatan: nilai duw dan dvw menggambarkan jarak rata-rata antara cluster 
U dengan W serta V dengan W. 

92 . 2 . 4 . Algoritma dan metode pengelompokan hirarki 
lainnya 

Secara umum, algoritma untuk metode pengelompokan hirarki adalah : 

1. Tentukan matriks jarak antar data atau kelompok 

2. Gabungkan dua data atau kelompok terdekat ke dalam kelompok 
yang baru 

3. Tentukan kembali matrik jarak tersebut. 

4. Lakukan langkah 2 dan 3 sampai semua data masuk dalam satu 
kelompok 

Hasil pengelompokan tersebut dapat digambarkan dengan diagram 
pohon 3 dendrogram atau vicicle plot. Jumlah kelompok yang terjadi 
ditentukan dari dendrogram yang terjadi dan tergantung subyektivitas 
peneliti. Namun demikian pemisahan kelompok biasanya ditentukan 
berdasarkan jarak penggabungan terbesar. 

Sebenarnya masih banyak jenis dari metode analisis hierarki, Unweighted 
Pair-Group Average, Weighted Pair-Group Average, Unweighted Pair- 
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Group Centroid, Weighted Poir-Group Centroid, dan Word’s Method, 
tetapi karena kompleksitas pemakaiannya, motode ini relatif jarang 
digunakan. 

9 . 2 . 15 . Ilustrasi Metode Hierarkhi 

Kasus 1: 

Salah satu contoh sederhana dari single lingkoge akan diuraikan berikut 
ini. 

Misalkan kita memiliki matriks jarak D sebagai berikut: 


D = {dik} = 



12 3 4 5 

1 

0 

9 0 

3 7 0 

6 5 9 0 

11 10 2 8 0 

2 

3 

4 

Cn 


Tahapan: 

1. Clustering dilakukan dengan menggabungkan dua obyek yang 
memiliki jarak terdekat, yaitu : 


min (dik) = ds 3 = 2 

i,k 

2. Gabungkan Obyek 5 dan 3 menjadi satu cluster (35) dan selanjutnya 
hitung jarak objek lainnya terhadap cluster (35), seperti berikut: 

d(35)i = min {d3i,dsi} = min {3,11} = 3 

d( 35)2 = min {d32,d52} = min {7,10} = 7 

d( 35)4 = min {d34,d54} = min {9,8} = 8 
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Sehingga pengelompokan yang baru diperoleh : 



(35) 1 2 4 

(35) 

0 

1 

3 0 

2 

7 9 0 

8 6 5 0 

4 


3. Pengelompokan berikutnya yaitu penggabungan cluster 1 dengan 
(35) karena merupakan jarak terdekat, dan kemudian menghitung 
kembali jarak cluster lain terhadap cluster (135) tersebut: 

d( 135)2 = min {d(35)2,di2} = min {7,9} = 7 

d( 135)4 = min {d(35)4,di4} = min {8,6} = 6 

Sehingga pengelompokan yang baru diperoleh : 



(135) 

2 

4 

(135) 

0 

7 0 

6 5 0 

2 

4 


4. Pengelompokan berikutnya yaitu penggabungan cluster 2 dengan 4 
karena merupakan jarak terdekat, dan kemudian menghitung 
kembali jarak cluster lain terhadap cluster (24) tersebut: 

d( 135 )(24) = min {d(i35)2,d(i35)4} = min {7,6} = 6 

Sehingga pengelompokan yang baru diperoleh : 
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(135) 

(24) 

(135) 

0 

0 

(24) 

6 


5. Untuk selanjutnya cluster (135) dengan cluster (24) bergabung 
membentuk cluster tunggal dari kelima obyek tadi, sehingga 
diperoleh cluster (12345) dengan jarak terdekatnya = 6. 

Hasil dari proses perhitungan ini biasanya ditampilkan dalam bentuk 
dendogram sebagai berikut: 


Kasus 2: 

Misalkan ingin dilakukan pengelompokan propinsi-propinsi di pulau Jawa 
berdasarkan karakteristik penduduk lanjut usia (lansia). Hal ini dilakukan 
mengingat penduduk lansia semakin lama semakin banyak (penduduk 
lansia cenderung bertambah atau ada perubahan struktur dari struktur 
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penduduk muda ke struktur penduduk tua), sehingga perlu adanya 
perhatian ekstra dari pihak pemerintah untuk permasalahn tersebut. 
Digunakan enam criteria dalam penelitian ini, yaitu tidak pernah 
sekolah/tamat SD (sebagai criteria A), makan makanan pokok 
<21x/minggu (sebagai criteria B), makan lauk pauk berprotein tinggi 
<4x/minggu (sebagai criteria C), memiliki pakaian <4 stel (sebagai criteria 
D), tidak mempunyai tempat tetap untuk tidur (sebagai criteria E) dan bila 
sakit tidak di obati (sebagai criteria F). 


Tabel 9.1 Enam Kriteria Keterlantara Lansia Menurut Propinsi di pulau Jawa 


PROPINSI 

tidak pernah 
sekolah/tamat 

SD 

makan 

makanan 

pokok 

<21X 

dalam 

seminggu 

makan 

lauk pauk 
berprotein 
tinggi<4X 

dalam 

seminggu 

memiliki 
pakaian 
<4 stel 

tidak 

mempuny 

ai tempat 
tetap 
untuk tidur 

bila 

sakit 

tidak 

diob 

ati 

JABAR 

70.84 

70.48 

31.37 

17.17 

1.82 

5.32 

JATIM 

79.3 

35.99 

16.25 

19.36 

1.89 

3.97 

JATENG 

79.3 

35.99 

16.25 

19.36 

1.89 

3.97 

DIY 

76.05 

46.27 

11.35 

17.45 

1.17 

4.72 

BANTEN 

77.96 

42.48 

6.28 

25.74 

0.34 

4.87 

DKI 

37.8 

56.38 

12.28 

87.24 

1.45 

6.78 


Berikut akan dibahas beberapa metode yang digunakan dalam analisis 
gerombol 


a. Metode grafik 


Dalam metode ini menitikberatkan pada karakteristik yang secara 
signifikan berbeda antar gerombol dan memprediksi anggota dalam 
suatu gerombol khusus. Ada 3 plot yang digunakan yaitu plot profil, 
plot andrew dan plot Andrew termodifikasi. 
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Gambar 9.1 Plot Profil 
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Gambar 9.2 Plot Andrew 
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Gombar 9.3 Plot Andrew termodifikasi 

Berdasarkan ketiga plot diatas, dapat disimpulkan bahwa untuk 
propinsi DIY, BANTEN, JATENG, JATIM mempunyai profil atau 
karakteristik yang mirip sedangkan JABAR dan DKI mempunyai 
karekteristik sendiri - sendiri. 


Ukuran kemiripan dan ketakmiripan 

Sebelum melakukan analisis lebih lanjut, untuk menentukan kemiripan 
antar objek dilihat berdasarkan kedekatan jarak antar objek tersebut. 
Makin dekat jaraknya, maka makin mirip karakteristik kedua objek 
tersebut. Jarak yang paling umum digunakan adalah jarak Euclidean, 
yang mengukur jarak sesungguhnya menggunakan mata manusia. 
Dengan menggunakan data pada table 1, jika dihitung jarak Euclidean 
akan didapatkan matriks jarak sebagai berikut 
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Tabel 9.2. Matriks jarak 



Jabar 

Jatim 

Jateng 

DIY 

Banten 

DKI 

Jabar 

0 

46.51556 

38.68294 

31.85796 

39.3863 

81.03674 

Jatim 

46.51556 

0 

13.03541 

21.82378 

16.1744 

76.68378 

Jateng 

38.68294 

13.03541 

0 

12.04076 

13.58961 

82.27726 

DIY 

31.85796 

21.82378 

12.04076 

0 

10.71021 

80.2565 

Banten 

39.3863 

16.1744 

13.58961 

10.71021 

0 

75.06508 

DKI 

81.03674 

76.68378 

82.27726 

80.2565 

75.06508 

0 


b. Metode Berhirarki 

Metode hirarki paling banyak digunakan oleh para peneliti karena 
memiliki keunggulan tersendiri dimana pengelompokan yang 
terbentuk dapat terjadi secara alamiah. Awalnya dianggap n buah 
gerombol yang masing - masing beranggotakan satu objek. Dua 
gerombol yang paling dekat kemudian digabung dan selanjutnya 
ditentukan kembali kedekatan (atau jarak) antar (n-1) gerombol 
yang baru. Proses tersebut berlangsung sampai didapatkan hanya 
satu gerombol yang anggotanya adalah seluruh objek. Metode ini 
terdiri atas lima jenis yaitu: 

1. Pautan tunggal (tetangga terdekat) 

Dari matriks jarak yang diperoleh (tabel 2), yang memiliki jarak 
terdekat yaitu (DIY, Banten). Dengan demikian kedua objek 
tersebut dapat dikelompokkan dalam satu gerombol. Gerombol 
yang dihasilkan tadi, kemudian dibandingkan dengan objek 
yang lain, yang memiliki jarak terdekat dengan gerombol yang 
terbentuk. 
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• h{( DIY, Banten), Jabar} 
Jabar) 

• h{( DIY, Banten), Jatim} 
Jatim)} 

• h{( DIY, Banten), Jateng} 
Banten)} 

• h{{( DIY, Banten), DKI} 
DKI)} 


= min {d(DIY, Jabar), d(Banten, 

= min (31.85796, 39.3863) 

= 31.85796 

= min {d(DIY, Jatim), d(Banten, 

= min (21.82378, 16.1744) 

= 16.1744 

= min {d(DIY, Banten), d(Jateng, 

= min ( 10.71021, 13.58961) 

= 10.71021 

= min { d (DIY, DKI) ,d(Banten, 

= min (80.2565, 75.06508) 

= 75.06508 



Jabar 

Jatim 

Jateng 

(DIY, Banten) 

DKI 

Jabar 

0 

46.51556 

38.68294 

31.85796 

81.03674 

Jatim 

46.51556 

0 

13.03541 

16.1744 

76.68378 

Jateng 

38.68294 

13.03541 

0 

10.71021 

82.27726 

(DIY, Banten) 

31.85796 

16.1744 

10.71021 

0 

75.06508 

DKI 

81.03674 

76.68378 

82.27726 

75.06508 

0 


Dari matriks jarak diatas diperoleh jarak antara (DIY, Banten) dan 
Jateng yang paling kecil, sehingga dijadikan sebagai satu 
gerombol. Jadi matriks jarak baru yang terbentuk sebagai 
berikut: 
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• h{(Jateng, DIY, Banten), Jabar} 

= min {d(Jateng, Jabar), d (DIY, Jabar), d(Banten, 
Jabar)} 

= min (38.68294, 31.85796, 39.3863) 

= 31.85796 

• h{(Jateng, DIY, Banten), Jatim} 

= min {d(Jateng, Jatim), d (DIY, Jatim), d(Banten, Jatim)} 
= min (13.03541,21.82378, 16.1744) 

= 13.03541 

• h{(Jateng, DIY, Banten), DKI} 

= min {dfJateng, DKI), d (DIY, DKI), d(Banten, DKI)} 

= min (82.27726, 80.2565, 75.06508) 

= 75.06508 



Jabar 

Jatim 

(Jateng, DIY, Banten) 

DKI 

Jabar 

0 

46.51556 

31.85796 

81.03674 

Jatim 

46.51556 

0 

13.03541 

76.68378 

(Jateng, DIY, 

Banten) 

31.85796 

13.03541 

0 

75.06508 

DKI 

81.03674 

76.68378 

80.2565 

0 


Dari matriks jarak diatas diperoleh jarak antara (Jateng, DIY, Banten) dan 
Jatim yang paling kecil, sehingga dijadikan sebagai satu gerombol. Jadi 
matriks jarak baru yang terbentuk sebagai berikut: 
h{( Jateng, DIY, Banten, Jatim), Jabar} 

= min{d(Jateng,Jabar), d(DIY,Jabar), d(Banten,Jabar), d (Jatim, Jabar)} 

= min(36.68294, 31.85796, 39.3863, 46,51556) 

= 31.85796 













• h{( Jateng, DIY, Banten, Jatim), DKI} 

= min{d (Jateng, DKI), d (DIY, DKI), d(Banten, DKI), dfJatim, DKI)} 
= min (82.27726, 80.2565, 75.06508, 76,68378) 

= 75.06508 



Jabar 

(Jateng, DIY, Banten, Jatim) 

DKI 

Jabar 

0 

31.85796 

81.03674 

(Jateng, DIY, 

Banten, Jatim) 

31.85796 

0 

75.06508 

DKI 

81.03674 

75.06508 

0 


Dari matriks jarak baru yang terbentuk diperoleh jarak antara (Jateng, DIY, 
Banten, Jatim) dan Jabar yang paling kecil, sehingga dijadikan sebagai 
satu gerombol. Matriks jarak baru yang terbentuk sebagai berikut: 

• h{(Jateng,DI Y,Banten,Jatim, Jabar),DKI} 

= min{d(Jateng,DKI), d(DIY,DKI), d(Banten,DKI), d(Jatim,DKI), (Jabar,DKI)} 

= min (82.27726, 80.2565, 75.06508, 76,68378, 81.03674) 

= 75.06508 



(Jateng, DIY, Banten, Jatim, 

Jabar) 

DKI 

(Jateng, DIY, Banten, 

Jatim, Jabar) 

0 

75.06508 

DKI 

75.06508 

0 
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Dari matriks diatas akhirnya akan terbentuk satu gerombol yang terdiri dari 
seluruh propinsi di pulau Jawa yaitu (Jateng, DIY, Banten, Jatim, Jabar, 
dan DKI) 

Dari iterasi diatas, maka dapat digambarkan dalam bentuk dendogram 
berikut: 


Dendrogram with Single Linkage and Euclidean Distance 



Observations 


Dari dendogram tersebut dapat dilihat bahwa pengklasteran dimulai 
dengan penggerombolan antara DIY dan Banten sebagai satu gerombol, 
pada iterasi yang kedua Jateng bergerombol dengan (DIY dan Banten), 
iterasi ketiga (Jateng, DIY dan Banten) bergerombol dengan Jatim, iterasi 
keempat (Jatim, Jateng, DIY dan Banten) bergerombol dengan Jabar, 
dan pada iterasi yang terakhir semua propinsi (Jabar, Jatim, Jateng, DIY, 
Banten, dan DKI) bergerombol menjadi satu gerombol. Jadi, jika kita 
menginginkan dua gerombol, maka gerombol pertama terdiri dari Jatim, 
Jateng, DIY dan Banten dan gerombol kedua terdiri dari Jabar dan DKI. 

Algoritma penyelesaian dengan menggunakan pautan lengkap, rata- 
rata, ward, dan centroid pada dasarnya penyelesaiannya sama dengan 
pautan tunggal, yang membedakannya adalah pada pautan tunggal 
menggunakan jarak minimum, sedangkan pada pautan lengkap 
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menggunakan jarak maximum, pautan rata- rata didasarkan atas 
observasi dengan jarak paling mendekati jarak rata - rata, metode ward 
didasarkan atas jumlah kuadrat antara dua gerombol untuk seluruh 
variable , dan metode centorid didasarkan atas jarak antar centroid 
gerombol tersebut. 

9.2.3. Metode tak berhirarki 

Salah satu metode dalam metode penggerombolan tak berhirarki yaitu 
metode k-means. Algoritma dari metode ini sebagai berikut pertama 
tentukan besarnya k (yaitu banyaknya gerombol, dan tentukan juga 
centroid di tiap gerombol), kedua hitung jarak antara setiap objek 
dengan setiap centroid, ketiga hitung kembali rataan (centroid) untuk 
gerombol yang baru terbentuk dan keempat ulangi langkah 2 sampai 
tidak ada lagi pemindahan objek antar gerombol. 

Dua masalah utama yang harus diketahui dalam penggerombolan non 
hierarki adalah jumlah gerombol dan pemilihan pusat gerombol 
(centroid). Lebih lanjut, hasil penggerombolan mungkin tergantung pada 
pusat (centers) dipilih. Banyak program pengerombolan non-hierarki, 
memilih k objek (kasus) yang pertama sebagai pusat gerombol (centroid). 
Sehingga hasil penggerombolan mungkin tergantung pada urutan 
observasi dalam data. Bagaimanapun juga, penggerombolan non- 
hierarki lebih cepat daripada metode hirarki dan lebih menguntungkan 
jika jumlah objek/kasus atau observasi besar sekali(sampel besar). 

92.3. L Mefode K-Rataan 

MacQueen menyarankan penggunaan K-rataan untuk menjelaskan 
algoritma dalam penentuan suatu objek ke dalam gerombol tertentu 
berdasarkan rataan terdekat. Dalam bentuk yang paling sederhana, 
proses ini terdiri dari tiga tahap: 
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1. Bagi objek-objek tersebut ke dalam K gerombol awal. 

2. Masukkan tiap objek ke suatu gerombol berdasarkan rataan 
terdekat. Jarak biasanya ditentukan dengan menggunakan 
Euclidean. Hitung kembali rataan untuk gerombol yang mendapat 
objek dan yang kehilangan objek. 

3. Ulangi langkah 2 sampai tidak ada lagi pemindahan objek antar 
gerombol. 

Dalam membagi objek ke dalam K kelompok permulaan (pada langkah 
1), sebelumnya dapat ditentukan rataan untuk K inisial, baru kemudian 
dilanjutkan dengan langkah berikutnya. 

Penentuan terakhir suatu objek ke suatu gerombol tertentu tidak 
tergantung dari K inisial yang pertama kali ditentukan. Pengalaman 
menunjukkan bahwa perubahan terbesar hanya terjadi pada realokasi 
yang pertama saja. 


9.23.2 Ilustrasi Metode penggerombolan hierarkhi 

Misalkan ada dua variabel X/ dan X 2 yang tiap objeknya diberi inisial A, B, 
C dan D. Akan dilakukan pengelompokan menggunakan metode Ke¬ 
rataan. Datanya sebagai berikut 


Objek 

Pengamatan 

Xl 

X2 

A 

5 

3 

B 

-1 

1 

C 

1 

-2 

D 

-3 

-2 


Objek-objek diatas dibagi menjadi 2 gerombol (K=2) sedemikan sehingga 
antar objek dalam satu gerombol mempunyai hubungan yang lebih 
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dekat dari pada objek antar gerombol. Dengan menggunakan metode 
K=2 rataan, pembagian objek menjadi 2 gerombol , seperti (AB) dan (CD) 
dan kemudian menghitung koordinat ( jc i, x 2 ) sebagai rataan dari 
gerombol. Dari langkah pertama dihasilkan: 


Cluster 

Koordinat Rataan 

X 1 

12 

(AB) 

5 + (-D =2 

3 + (1) =2 


2 

2 

(CD) 

1 + ( - 3) _ ] 

- 2 + (-2) = _ 2 


2 

2 


Pada langkah ke 2, dengan menggunakan perhitungan Euclidean 
dihitung jarak setiap objek dari pusat gerombol (rataannya) dan 
memasukkannya ke dalam gerombol terdekat. Pada setiap pemindahan 
objek pada suatu gerombol tertentu, K rataannya harus dihitung kembali 
sebelum dilanjutkan ke proses berikutnya. Perhitungan jaraknya sebagai 
berikut: 

d 2 (A,(AB))= (5-2) 2 +(3-2) 2 = 10 
d 2 (A,(CD))= (5+1 ) 2 +(3+2)2=61 

Karena jarak A lebih dekat dengan (AB) daripada dengan (CD), maka A 
tidak perlu pindah dari gerombol (AB). Dilanjutkan dengan : 

d 2 (B, (AB)) = (-1 +1 ) 2 +(l +2)2 =10 

d 2 (B,(CD))= (-1 + 1 ) 2 +(l + 2 ) 2 = 9 

Karena jarak B lebih dekat ke (CD) dari pada ke (AB) , maka perlu ada 
pemindahan (B) ke gerombol (CD) sehingga sekarang terbentuk suatu 
gerombol baru yaitu (BCD) dengan koordinat baru. 
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Cluster 

Koordinat Rataan 

X 1 

X 2 

(A) 

5 

3 

(BCD) 

-1 

-0.5 


Kemudian periksa lagi setiap objek tersebut. Perhitungannya sebagai 
berikut: 

Kuadrat Jarak ke Rataan Grup 


Gerombol 

Objek 

A 

B 

C 

D 

(A) 

0 

40 

41 

89 

(BCD) 

48.25 

2.25 

6.25 

6.25 


Dapat dilihat sekarang bahwa setiap objek sudah menunjuk ke suatu 
gerombol dengan rataan terdekat sehingga proses berhenti sampai disini. 
Gerombol akhir yang terbentuk adalah A dan (BCD). 

Untuk memeriksa kestabilan dari pembentukan gerombol disarankan 
untuk mengulang kembali langkah-langkah tersebut diatas dengan inisial 
gerombol awal yang berbeda. 

9.3. Aplikasi SAS 

Prosedur SAS yang digunakan untuk analisis gerombol adalah PROC 
CLUSTER. 

Bentuk umum dari PROC CLUSTER adalah 
PROC CLUSTER <options>; 

ID variables; 

Run; 
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Berikut akan diberikan contoh penggunaan analisis gerombol berhirarki 
yang diterapkan pada penggerombolan mamalia berdasarkan struktur 
giginya. Mamalia yang terlibat adalah : BROWN BAT, MOLE, SILVER HAIR 
BAL PIGMY BAL HOUSE BAL REDB AL PIKA, RABBIT, BEAVER, GROUNDHOG, 
GRAYS QUIRREL, HOUSE MOUSE, PORCUPINE, WOLF, BEAR, RACCOON, 
MARTEN, WEASEL, WOLVERINE, BADGER, RIVER OTTER, SEA OTTER, JAGUAR, 
COUGAR, FURSEAL, SEALION, GREY SEAL, ELEPHANT SEAL, REINDEER, ELK, 
DEER, MOOSE 


Berikut adalah data yang digunakan dalam analisis gerombol. Ada 8 
peubah yang berkenaan dengan gigi mamalia, yaitu VI hingga V8. 


title 'HIERARCHICAL CLUSTER ANALYSIS OF MAMMALS'' TEETH 
DATA ’ ; 

title2 'Evaluating the Effects of Ties’; 
data teeth; 

input mammal $ 1-16021 (vl-v8) (1.); 

label vl='Top incisors' 

v2='Bottom incisors’ 
v3='Top canines' 
v4='Bottom canines' 
v5='Top premolars' 
v6='Bottom premolars' 
v7='Top molars' 
v8='Bottom molars'; 
datalines; 


BROWN BAT 

23113333 

MOLE 

32103333 

SILVER HAIR BAT 

23112333 

PIGMY BAT 

23112233 

HOUSE BAT 

23111233 

RED BAT 

13112233 

PIKA 

21002233 

RABBIT 

21003233 

BEAVER 

11002133 

GROUNDHOG 

11002133 

GRAY SQUIRREL 

11001133 

HOUSE MOUSE 

11000033 

PORCUPINE 

11001133 

WOLF 

33114423 

BEAR 

33114423 

RACCOON 

33114432 

MARTEN 

33114412 

WEASEL 

33113312 
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WOLVERINE 

33114412 






BADGER 

33113312 






RIVER OTTER 

33114312 






SEA OTTER 

32113312 






JAGUAR 

33113211 






COUGAR 

33113211 






FUR SEAL 

32114411 






SEA LION 

32114411 






GREY SEAL 

32113322 






ELEPHANT SEAL 

21114411 






REINDEER 

04103333 






ELK 

04103333 






DEER 

04003333 






MOOSE 

04003333 






proc cluster data=teeth CCC method=single 

outtree 

var vl-v8; 







id mammal; 







run; 







proc tree; 







id mammal; 







title3 'Pohon Gerombol'; 






run; 







Keluaran dari perintah di atas adalah : 


Cluster Hi 

sto 

ry 




NCL -Cluster 

s Joined- FREQ 

SPRSQ 

RSQ 

ERSQ CCC 

31 BEAVER 

GROUNDHOG 

2 

0 

0000 

1.00 


30 GRAY SQUIRREL 

PORCUPINE 

2 

0 

0000 

1.00 


29 WOLF 

BEAR 

2 

0 

0000 

1.00 


28 MARTEN 

WOLVERINE 

2 

0 

0000 

1.00 


27 WEASEL 

BADGER 

2 

0 

0000 

1.00 


2 6 JAGUAR 

COUGAR 

2 

0 

0000 

1.00 


25 FUR SEAL 

SEA LION 

2 

0 

0000 

1.00 


24 REINDEER 

ELK 

2 

0 

0000 

1.00 


23 DEER 

MOOSE 

2 

0 

0000 

1.00 


22 BROWN BAT 

SILVER HAIR BAT 

2 

0 

0025 

.998 


21 CL22 

PIGMY BAT 

3 

0 

0042 

.993 


20 CL21 

HOUSE BAT 

4 

0 

0083 

.985 


19 CL20 

RED BAT 

5 

0 

0050 

.980 


18 PIKA 

RABBIT 

2 

0 

0025 

. 978 


17 CL31 

CL30 

4 

0 

0050 

.973 


16 CL28 

RIVER OTTER 

3 

0 

0033 

.969 


15 CL16 

CL27 

5 

0 

0087 

. 961 


14 CL15 

SEA OTTER 

6 

0 

0063 

.954 


13 CL14 

GREY SEAL 

7 

0 

0088 

.945 


12 CL24 

CL23 

4 

0 

0050 

. 940 


11 CL18 

CL17 

6 

0 

0200 

.920 


10 CL11 

HOUSE MOUSE 

7 

0 

0225 

.898 


9 CL2 9 

RACCOON 

3 

0 

0067 

.891 


8 CL9 

CL13 

10 

0 

0292 

.862 


7 CL8 

CL2 6 

12 

0 

0362 

.826 


6 CL7 

CL25 

14 

0 

0230 

.803 

.779 1.25 

5 CL6 

ELEPHANT SEAL 

15 

0 

0252 

.778 

.741 1.50 

1_ 









4 

CL19 

MOLE 

6 

0.0200 

.758 

.691 

2.13 

0.5213 T 

3 

CL4 

CL5 

21 

0.1722 

.585 

. 614 

-.73 

0.5213 

2 

CL3 

CL10 

28 

0.4033 

.182 

.465 

-4.2 

0.6019 

1 

CL2 

CL12 

32 

0.1821 

.000 

.000 

0.00 

0.673 


Terlihat bahwa nilai CCC tertinggi ketika banyaknya gerombol adalah 6, 
namun nilai CCC ini pada saat banyaknya gerombol 5 tidak berbeda 
jauh. Sekarang kita perhatikan bagaimana bentuk dari pohon 
gerombolnya. 


HIERARCHICAL CLUSTER ANALYSIS OF MAMMALS' TEETH DATA 

Evaluating the Effects of T ies 
Pohon Gerombol 
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Jika kita amati, banyaknya gerombol 5 cukup memuaskan. Gerombol 
yang pertama merupakan mamalia dari keluarta BAT (kelelawar), 
gerombol berikutnya adalah kelompok mamalia pemakan daging, 
kemudian ada gerombol mamalia pengerat, gerombol mamalia 
pemakan rumbuhan dan terakhir MOLE. Nampak jelas bahwa 


penggerombolan ini cukup masuk akal. 
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9.4. Latihan 


1. Didapatkan hasil dendogram sebagai berikut: 


Dendrogram using Average Linkage (Between Groups) 
Rescaled Distance Cluster Combine 

0 5 10 15 20 25 



a. Berdasarkan hasil diatas, ada berapa gerombol yang 
terbentuk? 

b. Sebutkan anggota dari masing-masing gerombol! 


2 . 


Diketahui matriks jarak 


A 

B 

D = C 
D 
E 


0 

9 

3 

6 

11 


9 3 6 11- 

0 7 5 10 

7 O 92 

5 9 0 8 

10 2 8 0 J 
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Kelompokkan dan gambarkan dalam bentuk dendogram serta 
bandingkan hasilnya dari 5 pengamatan A,B,C,D, dan E 
menggunakan metode penggerombolan berikut: 

a. Single Linkage 

b. Complete Linkage 

c. Average Linkage 

3. Diketahui korelasi diantara 5 toko penyedia bahan makanan pokok 
di kota Bogor adalah sebagai berikut 



Sumber 



Victory 


Makmur 

Sri Rejeki 

Sentosa 

Jaya Sriwangi 

Sumber Makmur 

1 




Sri Rejeki 

0.58 

1 



Sentosa 

0.51 

0.6 

1 


Victory Jaya 

0.39 

0.39 

0.44 

1 

Sriwangi 

0.46 

0.32 

0.43 

0.52 1 


a. Gerombolkan toko-toko tersebut dengan metode single linkage 
dan compplete linkage! 

b. Gambarkan dendogram dan bandingkan hasilnya. 


4. 


Didapatkan pengukuran peubah Xi dan X 2 untuk objek A,B,C dan D 
sebagai berikut 



Observsasi 

Xi x 2 

A 

5 4 

B 

1 -2 

C 

-1 1 

D 

3 1 


a. Gunakam K-means clustering untuk membagi objek menjadi 2 
kelompok K=2 dengan grup inisial awal adalah (AB) dan (CD) 

b. Ulangi sepertipada soal a tetapi grup inisial awal adalah (AC) 
dan (BD) 

c. Bandingkan kedua hasilnya. 
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10 


lO.Analisis Diskriminan (Discriminant Analysis) 


10.1. Pendahuluan 


Analisis diskriminan adalah salah satu teknik statistik yang bisa digunakan 
pada hubungan dependensi (hubungan antarvariabel dimana sudah 
bisa dibedakan mana variabel respon dan mana variabel penjelas). Lebih 
spesifik lagi, analisis diskriminan digunakan pada kasus dimana variabel 
respon berupa data kualitatif dan variabel penjelas berupa data 
kuantitatif. Analisis diskriminan bertujuan untuk mengklasifikasikan suatu 
individu atau observasi ke dalam kelompok yang saling bebas (mutually 
exclusive/disjoint) dan menyeluruh (exhaustive ) berdasarkan sejumlah 
variabel penjelas. 

Ada dua asumsi utama yang harus dipenuhi pada analisis diskriminan ini, 
yaitu: 

2. Sejumlah p variabel penjelas harus berdistribusi normal. 

3. Matriks varians-covarians variabel penjelas berukuran pxp pada 
kedua kelompok harus sama. 

Jika dianalogikan dengan regresi linier, maka analisis diskriminan 
merupakan kebalikannya. Pada regresi linier, variabel respon yang harus 
mengikuti distribusi normal dan homoskedastis, sedangkan variabel 
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penjelas diasumsikan fixed, artinya variabel penjelas tidak disyaratkan 
mengikuti sebaran tertentu. Untuk analisis diskriminan, variabel 
penjelasnya seperti sudah disebutkan di atas harus mengikuti distribusi 
normal dan homoskedastis, sedangkan variabel responnya fixed. 

10.2. Model Analisis Diskriminan 

Model dasar analisis diskriminan mirip regresi berganda. Perbedaannya 
adalah kalau variable dependen regresi berganda dilambangkan 
dengan Y, maka dalam analisis diskriminan dilambangkan dengan D. 

Model dasar analisis diskriminan adalah sebuah persamaan yang 
menunjukkan suatu kombinasi linear dari berbagai variable independent, 
yaitu : 


D — bo + biX± + ^ 2^2 “k ^ 3 X 3 + bfcKfc 


Dimana : 

D = skor diskriminan 

b = koefisien diskriminan atau bobot 

X f= predictor atau variable independen 

Yang diestimasi adalah koefisien ‘b’, sehingga nilai ‘D’ setiap grup 
sedapat mungkin berbeda. Ini terjadi pada saat rasio jumlah kuadrat 
antargrup ( between-group sum of squore ) terhadap jumlah kuadrat 
dalam grup ( w ifhin-group sum of squore ) untuk skor diskriminan 
mencapai maksimum. Berdasarkan nilai D itulah keanggotaan seseorang 
diprediksi. 


224 



Merangkum banyak peubah menjadi sebuah indeks atau menjadi 
sebuah criteria yang terandal akan sangat membantu proses klasifikasi. 
Namun perlu diingat bahwa kaidah keputusan pengklasifikasian 
berdasarkan indeks ataupun criteria apapun tidak selalu bisa diharapkan 
memiliki ketepatan yang sempurna. Artinya, dengan penyusunan indeks 
atau kriteria ini tetap selalu ada peluang kesalahan klasifikasi. Sewajarnya 
peluang kesalahan ini yang akan dikendalikan sehingga bisa dibuat 
sekecil mungkin. 

Fungsi Diskriminan memiliki ukuran yang menggambarkan tingkat 
ketepatan : 


Gambar Deskripsi umum analisis diskriminan 
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Anggota group A salah klasifikasi sebagai anggota group B 
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Ketika kita diminta untuk memprediksi individu mana termasuk ke dalam 
kelompok tertentu atau ketika kita diminta untuk mengidentifikasi sifat-sifat 
umum anggota suatu kelompok, maka kita berhadapan dengan 
persoalan pengelompokan dan penentuan sifat-sifat khas suatu 
kelompok. Misalnya, suatu wilayah dikatakan perkotaan, paling tidak, 
kalau (1) penduduknya banyak, (2) mempunyai banyak fasilitas, dan (3) 
kegiatan ekonomi penduduknya beragam. Sifat khas (1) dan (2) pada 
umumnya dapat dilihat secara kasat mata akan tetapi tidak pada sifat 
khas (3). Contoh lain, bagaimana kita dapat menentukan apakah 
seseorang miskin atau tidak miskin. Sifat umum dari orang miskin yang 
dapat dikenali barangkali adalah (1) kualitas rumah tinggalnya yang 
rendah, (2) porsi pengeluaran untuk makanan sangat besar (lebih dari 80 
persen), dan (3) tingkat pendidikannya rendah. 

Dalam teknik statistik, persoalan di atas biasanya diatasi dengan 
menggunakan analisis diskriminan. 11 Dua hal, yaitu pengelompokan dan 
identifikasi sifat khas suatu kelompok, dapat dilakukan sekaligus dengan 
analisis tersebut, di mana kelompok dikenal sebagai group dan sifat khas 
dikenal sebagai variabel pembeda (discriminating voriables). Antara 
kelompok dan variabel pembeda tersebut kemudian dibuat suatu 
hubungan fungsional yang disebut dengan fungsi diskriminan. 


11 Dalam literatur statistik lebih banyak disebut sebagai analisis fungsi 
diskriminan. 
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10.3. Fungsi Diskriminan 


Analisis ini didasarkan atas fungsi diskriminan yang mempunyai bentuk 
umum: 


^i. - Po + PiXi + ^2^2 "I- 1 - + £ i 

di mana Y merupakan variabel boneka ( dummy voriables ) yang 
menunjukkan kelompok dan Xi adalah variabel pembeda. Pada dasarnya 
fungsi diskriminan merupakan fungsi regresi ganda dengan variabel 
dependen merupakan variabel boneka yang mengambil nilai 1, 2, ..., k 
yang sesuai dengan pengelompokan awal setiap individu dan 
banyaknya kelompok (=k). 

Persyaratan awal yang harus dipenuhi sebelum melakukan analisis 
dengan fungsi diskriminan adalah: 

1. Setiap individu harus dikelompokkan hanya ke dalam satu dan 
hanya satu kelompok 

2. Varians dalam setiap kelompok adalah sama ( equol vorionces ) 

3. X berdistribusi normal ganda (multi voriotes normal distribution ) 

4. Banyaknya kelompok harus memenuhi 2 k<p, dengan p adalah 
banyaknya variabel pembeda. 13 

Analisis diskriminan dapat dilakukan bila terdapat perbedaan yang nyata 
antar kelompok, sehingga pada tahap awal yang harus dilakukan adalah 


13 Pada umumnya sangat sulit sekali untuk dapat memenuhi 
persyaratan (2) dan (3), yang dalam praktek tidak pernah diuji; halmana 
akan membuat akurasi dari analisis dengan fungsi diskriminan akan 
berkurang. Namun demikian, fungsi diskriminan selalu menghasilkan 
estimasi yang kokoh (robust estimates) terutama yang berkaitan dengan 
prediksi pengelompokan. 
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uji hipotesis nol bahwa tidak ada perbedaan kelompok di antara individu 
yang dirumuskan dengan: 


Ho: \i] = )i 2 =.= pik 

Hl: jii ^ jLij sij=l ,2,...,k (sedikitnya ada 2 kelompok yang berbeda), 
di mana 


|ij= [\. iij, jLt 2 j.^ipjl’adalah vektor rata-rata hitung peubah pembeda pada 

populasi ke-j dan jumlah individu yang dianalisis N = Z Ni, maka probabilita 
pengelompokan awal (prior probobility) adalah Ni/N. 

Uji hipotesis tersebut dilakukan dengan menggunakan statistik Khi Kuadrat 
yang diperoleh dari relasi dengan Wilk lambda (X) 14 yang menguji 
perbedaan antara dua kelompok. Jika H 0 benar maka Vj = {N - 1 - V 2 

(p+k)} /n (1 Aj) mengikuti distribusi Khi kuadrat dengan derajat bebas p(k- 
1). Pada output SPSS hal ini dapat dilihat dari Tabel B berikut. 


Tabel B: 


DISCRIMINANTF 

UNCTION 

EIGEN 

V ALU ES 

RELATIVE 

PERCENTAGE 

CANONICAL 

CORRELATION 

FUNCTION 

DERIVED 

WILK’S 

LAMBDA 

CHI- 

SOUARE 

DF 

SIG. 





0 

0.6329 

85.538 

12 

0.00 

1 

0.31781 

61.52 

0.491 

1 

0.8341 

33.931 

6 

0.000 

2 

0.19802 

38.33 

0.407 

2 

0.9992 

0.145 

2 

0.930 

3 

0.00078 

0.15 

0.028 







14 Dimana h = 1/(1+ej), dan ej adalah akar karakteristik (e/gen volue ) 
ke-j dari BW _1 . B adalah variasi/jumlah kuadarat antarkelompok ( between 
groups sum of squores ) dan W adalah variasi/jumlah kuadrat dalam 
kelompok (w ithin groups sum of sguares). 
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Sebelum fungsi diskriminan dibentuk -- FUNCTION DERIVED = 0 - tampak 
bahwa antarkelompok berbeda secara nyata dengan tingkat signifikansi 
sebesar 0,000. Dengan perkataan lain H 0 ditolak. 

Karena tujuan utama adalah pengelompokan, maka pembentukan 
fungsi diskriminan dicapai dengan menentukan (3j, j = l,2,3,...,p -- dengan 
proses matematika -- sedemikian rupa sehingga perbedaan 
antarkelompok sangat jelas. Banyaknya fungsi diskriminan yang dibentuk 
tergantung dari banyaknya kelompok yang diidentifikasi, yang secara 
umum adalah sebanyak k-1. Fungsi diskri-minan yang dibentuk 
merupakan kombinasi linier dari peubah pembeda yang dapat 
membedakan kelompok secara maksimum. 


10.4. Signifikansi Fungsi Diskriminan 

Setelah dapat ditunjukkan bahwa Ho: jii = ja 2 = . = jak ditolak, 

maka sebanyak k-1 fungsi diskriminan dapat dibentuk. Untuk mengetahui 
apakah k-1 fungsi diskriminan tersebut signifikan untuk membedakan k 
kelompok sehingga layak untuk digunakan untuk analisis selanjutnya, 
suatu uji dilakukan di mana statistik Bartlett Vj = {N - 1 - V 2 (p+k)} /n 

(1+ej) dengan N = Z Ni akan mengikuti distribusi Khi Kuadrat dengan 
derajat bebas p(k-l) jika H 0 benar. Contoh hasil uji dapat dilihat pada 

Tabel B di mana dari 3 fungsi diskriminan yang terbentuk untuk 
membedakan 4 kelompok hanya 2 fungsi diskriminan saja yang siginifikan 
untuk membedakan 4 kelompok. 

Untuk analisis diskriminan untuk membedakan dua kelompok uji hipotesis 
untuk mengetahui signifikansi fungsi diskriminan, statistik V Bartlett menjadi 
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lebih sederhana, yaitu: V={N 1 1 /4(p+2)}/n(l+e) mengikuti distribusi Khi- 
Kuadrat dengan derajat bebas p, jika H 0 benar. 

Menurut Johnson & Wichern (1982), tujuan fungsi pembeda adalah untuk 
menggambarkan ciri-ciri suatu pengamatan dari bermacam-macam 
populasi yang diketahui, baik secara grafis ataupun secara aljabar 
dengan membentuk fungsi pembeda. 

Fungsi pembeda layak dibentuk bila terdapat perbedaan nilai rata-rata 
diantara kelompok-kelompok yang ada, oleh karena itu sebelum fungsi 
pembeda dibentuk perlu dilakukan pengujian terhadap perbedaan 
vektor nilai rata-rata dari kelompok-kelompok tersebut. 

Seperti telah dijelaskan sebelumnya, dalam pengujian vektor nilai 
rata-rata antarkelompok, asumsi yang harus dipenuhi adalah: 

1. Peubah-peubah yang diamati menyebar secara normal ganda 
(multivariate normolity ). 

2. Semua kelompok populasi mempunyai matrik kovarians E yang 
sama ( equality of covorionce motrices). 

Berikut ini, diuraikan bagaimana melakukan pengujian kedua asumsi di 
atas secara manual dengan memanfaatkan rumus. 


10.4.1. Uji Kenormalan Multivariat 

Menurut Karson (1982), untuk menguji kenormalan multivariat digunakan 
prosedur yang dikembangkan oleh Mardia (1970) dengan cara 
menghitung dua macam ukuran statistik yaitu ukuran skewness (bi, P ) dan 
kurtosis (bzp) yaitu: 
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K V = ^2 X Z [(Xi “ ~ ^ 

Kv = - 1 )' 5 “ 1 ( X i -*)] 2 

Hipotesis yang digunakan adalah: 

H 0 : multivariat mengikuti sebaran normal 
Hi: multivariat tidak mengikuti sebaran normal 

Bila ( bi /P n/6 < y} p(p+1) (p+2)/6, dan 

[ b 2 , P - p (p+2) ] / V (8p (p+2)/n) <Z a (tabel normal), maka Ho diterima, 
berarti multivariat mengikuti sebaran normal. 

Menurut Johnson (1982), untuk menguji kenormalan ganda adalah 
dengan mencari nilai jarak kuadrat untuk setiap pengamatan yaitu 

af = (x i -xys-\x i -x) 

di mana Xi adalah pengamatan yang ke -i dan S ' 1 adalah kebalikan 
(/nverse) matrik kovarians S. 

Kemudian di 2 diurutkan dari kecil ke besar, selanjutnya dibuat plot di 2 

dengan nilai Chi-Kuadrat % 2 (i-l/2)/n , di mana i = urutan = 1,2,.n, 

dan p = banyaknya peubah. Bila hasil plot dapat didekati dengan garis 
lurus, maka dapat disimpulkan bahwa data menyebar secara normal 
ganda. 

Menurut Norusis (1986), berdasarkan teori Wahl & Kronmal (1977), seringkali 
kenormalan ganda sulit diperoleh terutama bila sampel yang diambil 
relatif kecil. Bila hal ini terjadi, uji vektor rata-rata tetap bisa dilakukan 
selama asumsi kedua (kesamaan kovarians) dipenuhi. 
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10.4.2. Uji Kesamaan Matriks Kovarians 

Untuk menguji kesamaan matriks kovarians (S) antar kelompok, 
digunakan hipotesa: 

Ho: Ei = E 2 =.= Ek = E 

H1: sedikitnya ada 2 kelompok yang berbeda 

Statistik uji yang digunakan adalah statistik Box’s, yaitu: 

-2 In X *= (n-k) In | W/(n-k) | - Z (ni-1) In | Sj | 

di mana: 


nl #'-’' 2 

|M//(n-/c)l (n “ fc)/2 


k = banyaknya kelompok 

W/(n-k) = matriks kovarians dalam kelompok gabungan 
Sj = matriks kovarians kelompok ke-j 
Bila hipotesa nol benar, maka: 

(-2 In X * )/b akan mengikuti sebaran F dengan derajat besar vi dan V 2 
pada taraf nyata a, di mana: 

vi = (1/2) (k-1) p (p+1) 

V2= (vi+2) / (02 — ai 2 ) 

b = vi/(l-ai - V1/V2) 

2 p 2 + 3p - 1 1 1 

ai = 6 (k - l)(p + 1) [L (n, - 1) “ (n - k\ 

= (p - 1Kp + 2) [y 1 _ 1 

02 6 (k — 1) |2j (nj — l) 2 (n — k') 2 

p = jumlah peubah pembeda dalam fungsi pembeda (discriminant). 
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Karena itu, apabila (-2 In X * )/b < Fvi,V2,a maka tidak ada alasan untuk 
menolak Ho dan dapat disimpulkan bahwa semua kelompok mempunyai 
matrik kovarians yang sama. Sebaliknya bila (-2 In X, * )/b > Fvi,V2,armaka 
Ho ditolak. 


10.4.3. Uji Vektor Nilai Rata-rata 

Pengujian terhadap vektor nilai rata-rata antarkelompok dilakukan 
dengan hipotesa: 

Ho : pii = pi 2 =.= juk 

H1 : sedikitnya ada 2 kelompok yang berbeda. 

Statistik uji yang digunakan adalah statistik V-Bartlett, yang mengikuti 
sebaran Chi-Kuadrat dengan derajat bebas p(k-l), bila bipotesa nol 
benar. 

Statistik V-Bartlett diperoleh melalui: 

V = - [ (n-1) - (p+k)/2 ] In (A) 

di mana: 

n = banyaknya pengamatan 

p = banyaknya peubah dalam fungsi pembeda ( discriminont ) 
k = banaknya kelompok 


\W\ 

\B + W\ 


Dalam hal ini: 

A = Wilk’s Lamda 

W = matrik jumlah kuadrat dan hasil kali data dalam kelompok 
B = matrik jumlah kuadrat dan hasil kali data antar kelompok 
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X| = pengamatan ke-j pada kelompok ke-i 

Xi = vektor rata-rata kelompok ke-i 

ni = jumlah pengamatan pada kelompok ke-i 

X = vektor rata-rata total 

Apabila V < %2 p(k-l ),(1 -a), maka tidak ada alasan untuk menolak Ho, ini 
berarti bahwa terdapat perbedaan vektor nilai rata-rata antarkelompok. 
Bila V > %2 p(k-l), (1-a), maka Ho ditolak. 

Bila dari hasil pengujian di atas ternyata ada perbedaan vektor nilai 
rataan, maka fungsi pembeda ( discriminont ) layak disusun untuk mengkaji 
hubungan antarkelompok serta berguna untuk mengelompokkan suatu 
obyek baru ke dalam salah satu kelompok tersebut. 

10.5. Variabel Pembeda Utama 

Untuk memperoleh fungsi diskriminan dengan SPSS digunakan 
METHOD=DIRECT. Dengan method ini, SPSS akan memberikan fungsi 
diskriminan yang merupakan kombinasi linier dari semua variabel 
pembeda sebagaimana pada persamaan (4.1). Namun demikian, 
dengan uji parsial signifikansi variabel pembeda akan dapat diperoleh 
variabel-variabel mana yang sebenarnya tidak berpengaruh nyata 
dalam membedakan kelompok sehingga tidak perlu ada dalam fungsi 
diskriminan. 

Penentuan variabel pembeda yang siginifikan dalam membedakan 
kelompok dapat dilakukan dengan cara bertatar ( stepwise ) yang 
prinsipnya sudah dibahas dalam Bab Analisis Regresi. Dalam SPSS, untuk 
memperoleh fungsi diskriminan yang merupakan kombinasi linier dari 
variabel pembeda utama dilakukan dengan cara menggunakan 
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METHOD 15 = Wilks’ lambda , Unexplained variance , Mahalanobis distance, 
Smallest F Ratio, Rao’s V. Dalam prosedur bertatar analisis diskriminan, 
setiap peubah pembeda yang tidak masuk dalam fungsi diskriminan 
berarti tidak menambah kemampuan membedakan kelompok 
(<discriminafing power) dari fungsi. 

Variabel pembeda utama yang dihasilkan dari proses bertatar 
merupakan ciri umum dari semua kelompok yang diteliti. Misalnya, jika Y 
menyatakan apakah individu merupakan penduduk miskin atau bukan 
miskin yang diperoleh apakah pengeluaran per kapita sebulan dari rumah 
tangganya di perkotaan di atas Rp.95.000,- atau di atas Rp.75.000,- di 
pedesaan. Variabel pembeda (X) yang diselidiki misalnya kualitas rumah 
tinggal, pendidikan kepala rumah tangga, jumlah anggota rumah 
tangga, jam kerja seminggu dari kepala rumah tangga. Dalam hal ini 
variabel pembeda merupakan ciri dari penduduk miskin. 


10.6. Evaluasi Fungsi Diskriminan 

Hasil pengelompokan menurut fungsi diskriminan tidak selalu sama 
dengan pengelompokan awal. Besarnya kesalahan pengelompokan, 
dengan menganggap pengelompokan awal adalah benar, merupakan 
indikator tingkat akurasi dari fungsi diskriminan yang dihasilkan. Matriks 14.2 
berikut menunjukkan evaluasi terhadap fungsi diskriminan. 


15 Untuk lebih mengetahui keunggulan dan kelemahan setiap 
motode bertatar, pembaca dianjurkan untuk membaca SPSS 
Reference Guide. 
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Matriks 14.2. Validasi hasil klasifikasi fungsi diskriminan 


PENGELOMPOKAN 

AWAL 

PENGELOMPOKAN MENURUT 
FUNGSI DISKRIMINAN 

JUMLAH 

1 

II 

1 

Nn 

N 12 

N,. 

II 

N21 

N 22 

N2« 

JUMLAH 

N., 

N »2 

N 


Dengan menggunakan Matriks 14.2 dapat dievaluasi tingkat akurasi fungsi 
diskriminan dengan memperhatikan: 

(a) . Persentase tepat pengelompokan = (Nn + N 12 ) / N 

(b) . Probabilita pengelompokan awal (prior probability) = Ni. / N 
Fungsi diskriminan dikatakan cukup baik jika (a) > 1,25 (b) 


10.7. Aplikasi SAS 

Ada tiga prosedur utama pada SAS untuk analisis diskriminan yakni: 

a. PROC CANDISC untuk analisis diskriminan kanonik 

b. PROC DISCRIM untuk analisis diskriminan linear 

c. PROC STEPDISC untuk analisis diskriminan bertatar 

PROC CANDISC selalu dikerjakan pertama kali. PROC DISCRIM yang 
kedua. Bentuk umum dari tahapan PROC CANDISC adalah 
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PROC CANDISC <options> 
CLASS variable; 

VAR variables; 

RUN; 


Berikut diberikan teladan penerapan analisis diskriminan untuk membuat 
fungsi pembeda antara 6 spesies ikan: BREAM, ROACH, WHITEFISH, PARKKI, 
PERCH, PIKE, SMELT. Peubah yang digunakan untuk menyusun fungsi 
diskriminan adalah BERAT TUBUH, PANJANG TUBUH, PANJANG KEPALA, 
PANJANG EKOR, TINGGI IKAN, LEBAR IKAN. 


Tahapan penyiapan datanya adalah 


proc format; 

value specfmt 
1='Bream' 

2='Roach 1 
3='Whitefish' 

4='Parkki' 

5='Perch' 

6='Pike' 

7='Smelt'; 

run; 

data fish (drop=HtPct WidthPct); 
title 'Fish Measurement Data'; 

input Species Weight Lengthl Length2 Length3 HtPct WidthPct @@; 
Height=HtPct*Length3/100; 

Width=WidthPct*Length3/100; 
format Species specfmt.; 

Symbol = put(Species, specfmt.); 
datalines; 


1 

242.0 

23.2 

25.4 

30.0 

38.4 

13.4 

1 

290.0 

24.0 

26.3 

31.2 

40.0 

13.8 

1 

340.0 

23.9 

26.5 

31.1 

39.8 

15.1 

1 

363.0 

26.3 

29.0 

33.5 

38.0 

13.3 

1 

430.0 

26.5 

29.0 

34.0 

3 6.6 

15.1 

1 

450.0 

26.8 

29.7 

34.7 

39.2 

14.2 

1 

500.0 

26.8 

29.7 

34.5 

41.1 

15.3 

1 

390.0 

27.6 

30.0 

35.0 

36.2 

13.4 

1 

450.0 

27.6 

30.0 

35.1 

39.9 

13.8 

1 

500.0 

28.5 

30.7 

36.2 

39.3 

13.7 

1 

475.0 

28.4 

31.0 

36.2 

39.4 

14.1 

1 

500.0 

28.7 

31.0 

36.2 

39.7 

13.3 

1 

500.0 

29.1 

31.5 

36.4 

37.8 

12.0 

1 


29.5 

32.0 

37.3 

37.3 

13.6 

1 

600.0 

29.4 

32.0 

37.2 

40.2 

13.9 

1 

600.0 

29.4 

32.0 

37.2 

41.5 

15.0 

1 

700.0 

30.4 

33.0 

38.3 

38.8 

13.8 

1 

700.0 

30.4 

33.0 

38.5 

38.8 

13.5 

1 

610.0 

30.9 

33.5 

38.6 

40.5 

13.3 

1 

650.0 

31.0 

33.5 

38.7 

37.4 

14.8 

1 

575.0 

31.3 

34.0 

39.5 

38.3 

14.1 

1 

685.0 

31.4 

34.0 

39.2 

40.8 

13.7 

1 

620.0 

31.5 

34.5 

39.7 

39.1 

13.3 

1 

680.0 

31.8 

35.0 

40.6 

38.1 

15.1 

1 

700.0 

31.9 

35.0 

40.5 

40.1 

13.8 

1 

725.0 

31.8 

35.0 

40.9 

40.0 

14.8 

1 

720.0 

32.0 

35.0 

40.6 

40.3 

15.0 

1 

714.0 

32.7 

36.0 

41.5 

39.8 

14.1 

1 

850.0 

32.8 

36.0 

41.6 

40.6 

14.9 

1 

1000.0 

33.5 

37.0 

42.6 

44.5 

15.5 

1 

920.0 

35.0 

38.5 

44.1 

40.9 

14.3 

1 

955.0 

35.0 

38.5 

44.0 

41.1 

14.3 

1 

925.0 

36.2 

39.5 

45.3 

41.4 

14.9 

1 

975.0 

37.4 

41.0 

45.9 

40.6 

14.7 

1 

950.0 

38.0 

41.0 

46.5 

37.9 

13.7 








2 

40.0 

12.9 

14.1 

16.2 

25.6 

14.0 

2 

69.0 

16.5 

18.2 

20.3 

26.1 

13.9 

2 

78.0 

17.5 

18.8 

21.2 

26.3 

13.7 

2 

87.0 

18.2 

19.8 

22.2 

25.3 

14.3 

2 

120.0 

18.6 

20.0 

22.2 

28.0 

16.1 

2 

0.0 

19.0 

20.5 

22.8 

28.4 

14.7 

2 

110.0 

19.1 

20.8 

23.1 

26.7 

14.7 

2 

120.0 

19.4 

21.0 

23.7 

25.8 

13.9 

2 

150.0 

20.4 

22.0 

24.7 

23.5 

15.2 

2 

145.0 

20.5 

22.0 

24.3 

27.3 

14.6 

2 

160.0 

20.5 

22.5 

25.3 

27.8 

15.1 

2 

140.0 

21.0 

22.5 

25.0 

26.2 

13.3 
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2 

160 . 

.0 

21 

.1 

22 , 

.5 

25 

0 

25 , 

. 6 

15 

2 

2 

169 , 

.0 

22 

.0 

24 , 

.0 

27 

.2 

27 , 

. 7 

14 

.1 

2 

161 . 

.0 

22 

.0 

23 , 

. 4 

26 

7 

25 , 

. 9 

13 

6 

2 

200 , 

.0 

22 

. 1 

23 , 

.5 

26 

.8 

27 , 

.6 

15 

. 4 

2 

180 . 

.0 

23 

. 6 

25 , 

.2 

27 

9 

25 , 

. 4 

14 

0 

2 

290 , 

.0 

24 

.0 

26 , 

.0 

29 

.2 

30 , 

. 4 

15 

. 4 

2 

272 . 

.0 

25 

.0 

27 , 

.0 

30 

6 

28 , 

.0 

15 

6 

2 

390 , 

.0 

29 

.5 

31 , 

. 7 

35 

.0 

27 , 

. 1 

15 

.3 

3 

270 . 

.0 

23 

. 6 

26 , 

.0 

28 

7 

29 , 

.2 

14 

8 

3 

270 , 

.0 

24 

. 1 

26 , 

.5 

29 

.3 

27 , 

.8 

14 

.5 

3 

306 . 

.0 

25 

. 6 

28 , 

.0 

30 

8 

28 , 

.5 

15 

2 

3 

540 , 

.0 

28 

.5 

31 , 

.0 

34 

.0 

31 , 

.6 

19 

.3 

3 

800 . 

.0 

33 

. 7 

36 , 

. 4 

39 

6 

29 , 

. 7 

16 

6 

3 

1000 , 

.0 

37 

.3 

40 , 

.0 

43 

.5 

28 , 

. 4 

15 

.0 

4 

55 . 

.0 

13 

.5 

14 , 

. 7 

16 

5 

41 , 

.5 

14 

1 

4 

60 , 

.0 

14 

.3 

15 , 

.5 

17 

. 4 

37 , 

.8 

13 

.3 

4 

90 . 

.0 

16 

.3 

17 , 

. 7 

19 

8 

37 , 

. 4 

13 

5 

4 

120 , 

.0 

17 

.5 

19 , 

.0 

21 

.3 

39 , 

. 4 

13 

. 7 

4 

150 . 

.0 

18 

. 4 

20 , 

.0 

22 

4 

39 , 

. 7 

14 

7 

4 

140 , 

.0 

19 

.0 

20 , 

. 7 

23 

.2 

36 , 

.8 

14 

.2 

4 

170 . 

.0 

19 

.0 

20 , 

. 7 

23 

2 

40 , 

.5 

14 

7 

4 

145 , 

.0 

19 

.8 

21 , 

.5 

24 

.1 

40 , 

.4 

13 

.1 

4 

200 . 

.0 

21 

.2 

23 , 

.0 

25 

8 

40 , 

.1 

14 

2 

4 

273 , 

.0 

23 

.0 

25 , 

.0 

28 

.0 

39 , 

. 6 

14 

.8 

4 

300 . 

.0 

24 

.0 

26 , 

.0 

29 

0 

39 , 

.2 

14 

6 














5 

5 . 

. 9 

7 

.5 

8 , 

.4 

8 

8 

24 , 

.0 

16 

0 

5 

32 , 

.0 

12 

.5 

13 , 

. 7 

14 

.7 

24 , 

.0 

13 

. 6 

5 

40 . 

.0 

13 

.8 

15 , 

.0 

16 

0 

23 , 

. 9 

15 

2 

5 

51 , 

.5 

15 

.0 

16 , 

.2 

17 

.2 

26 , 

. 7 

15 

.3 

5 

70 . 

.0 

15 

.7 

17 , 

.4 

18 

5 

24 , 

.8 

15 

9 

5 

100 , 

.0 

16 

.2 

18 , 

.0 

19 

.2 

27 , 

.2 

17 

.3 

5 

78 . 

.0 

16 

.8 

18 , 

. 7 

19 

4 

26 , 

.8 

16 

1 

5 

80 , 

.0 

17 

.2 

19 , 

.0 

20 

.2 

27 , 

. 9 

15 

.1 

5 

85 . 

.0 

17 

.8 

19 , 

. 6 

20 

8 

24 , 

. 7 

14 

6 

5 

85 , 

.0 

18 

.2 

20 , 

.0 

21 

.0 

24 , 

.2 

13 

.2 

5 

110 . 

.0 

19 

.0 

21 , 

.0 

22 

5 

25 , 

.3 

15 

8 

5 

115 , 

.0 

19 

.0 

21 , 

.0 

22 

.5 

26 , 

.3 

14 

.7 

5 

125 . 

.0 

19 

.0 

21 , 

.0 

22 

5 

25 , 

.3 

16 

3 

5 

130 , 

.0 

19 

.3 

21 , 

.3 

22 

.8 

28 , 

.0 

15 

.5 

5 

120 . 

.0 

20 

.0 

22 , 

.0 

23 

5 

26 , 

.0 

14 

5 

5 

120 , 

.0 

20 

.0 

22 , 

.0 

23 

.5 

24 , 

.0 

15 

.0 

5 

130 . 

.0 

20 

.0 

22 , 

.0 

23 

5 

26 , 

.0 

15 

0 

5 

135 , 

.0 

20 

.0 

22 , 

.0 

23 

.5 

25 , 

.0 

15 

.0 

5 

110 . 

.0 

20 

.0 

22 , 

.0 

23 

5 

23 , 

.5 

17 

0 

5 

130 , 

.0 

20 

.5 

22 , 

.5 

24 

.0 

24 , 

. 4 

15 

. 1 

5 

150 . 

.0 

20 

.5 

22 , 

.5 

24 

0 

28 , 

.3 

15 

1 

5 

145 , 

.0 

20 

. 7 

22 , 

. 7 

24 

.2 

24 , 

.6 

15 

.0 

5 

150 . 

.0 

21 

.0 

23 , 

.0 

24 

5 

21 , 

.3 

14 

8 

5 

170 , 

.0 

21 

.5 

23 , 

.5 

25 

.0 

25 , 

. 1 

14 

. 9 

5 

225 . 

.0 

22 

.0 

24 , 

.0 

25 

5 

28 , 

.6 

14 

6 

5 

145 , 

.0 

22 

.0 

24 , 

.0 

25 

.5 

25 , 

.0 

15 

.0 

5 

188 . 

.0 

22 

. 6 

24 , 

.6 

26 

2 

25 , 

. 7 

15 

9 

5 

180 , 

.0 

23 

.0 

25 , 

.0 

26 

.5 

24 , 

.3 

13 

.9 

5 

197 . 

.0 

23 

.5 

25 , 

.6 

27 

0 

24 , 

.3 

15 

7 

5 

218 , 

.0 

25 

.0 

26 , 

.5 

28 

.0 

25 , 

.6 

14 

.8 

5 

300 . 

.0 

25 

.2 

27 , 

.3 

28 

7 

29 , 

.0 

17 

9 

5 

260 , 

.0 

25 

. 4 

27 , 

.5 

28 

.9 

24 , 

.8 

15 

.0 

5 

265 . 

.0 

25 

. 4 

27 , 

.5 

28 

9 

24 , 

. 4 

15 

0 

5 

250 , 

.0 

25 

. 4 

27 , 

.5 

28 

. 9 

25 , 

.2 

15 

.8 

5 

250 . 

.0 

25 

. 9 

28 , 

.0 

29 

4 

26 , 

.6 

14 

3 

5 

300 , 

.0 

26 

.9 

28 , 

. 7 

30 

. 1 

25 , 

.2 

15 

. 4 

5 

320 . 

.0 

27 

.8 

30 , 

.0 

31 

6 

24 , 

. 1 

15 

1 

5 

514 , 

.0 

30 

.5 

32 , 

.8 

34 

.0 

29 , 

.5 

17 

. 7 

5 

556 . 

.0 

32 

.0 

34 , 

.5 

3 6 

5 

28 , 

. 1 

17 

5 

5 

840 , 

.0 

32 

.5 

35 , 

.0 

37 

.3 

30 , 

.8 

20 

. 9 

5 

685 . 

.0 

34 

.0 

36 , 

.5 

39 

0 

27 , 

. 9 

17 

6 

5 

700 , 

.0 

34 

.0 

36 , 

.0 

38 

.3 

27 , 

. 7 

17 

. 6 

5 

700 . 

.0 

34 

.5 

37 , 

.0 

39 

4 

27 , 

.5 

15 

9 

5 

690 , 

.0 

34 

. 6 

37 , 

.0 

39 

.3 

26 , 

. 9 

16 

.2 

5 

900 . 

.0 

36 

.5 

39 , 

.0 

41 

4 

26 , 

. 9 

18 

1 

5 

650 , 

.0 

36 

.5 

39 , 

.0 

41 

.4 

26 , 

. 9 

14 

.5 

5 

820 . 

.0 

36 

. 6 

39 , 

.0 

41 

3 

30 , 

.1 

17 

8 

5 

850 , 

.0 

36 

. 9 

40 , 

.0 

42 

.3 

28 , 

.2 

16 

.8 

5 

900 . 

.0 

37 

.0 

40 , 

.0 

42 

5 

27 , 

. 6 

17 

0 

5 

1015 , 

.0 

37 

.0 

40 , 

.0 

42 

.4 

29 , 

.2 

17 

. 6 

5 

820 . 

.0 

37 

.1 

40 , 

.0 

42 

5 

26 , 

.2 

15 

6 

5 

1100 , 

.0 

39 

.0 

42 , 

.0 

44 

. 6 

28 , 

. 7 

15 

.4 

5 

1000 . 

.0 

39 

.8 

43 , 

.0 

45 

2 

26 , 

.4 

16 

1 

5 

1100 , 

.0 

40 

.1 

43 , 

.0 

45 

.5 

27 , 

.5 

16 

.3 

5 

1000 . 

.0 

40 

.2 

43 , 

.5 

46 

0 

27 , 

.4 

17 

7 

5 

1000 , 

.0 

41 

.1 

44 , 

.0 

46 

. 6 

26 , 

.8 

16 

.3 

6 

200 . 

.0 

30 

.0 

32 , 

.3 

34 

8 

16 , 

.0 

9 

7 

6 

300 , 

.0 

31 

.7 

34 , 

.0 

37 

.8 

15 , 

.1 

11 

.0 

6 

300 . 

.0 

32 

.7 

35 , 

.0 

38 

8 

15 , 

.3 

11 

3 

6 

300 , 

.0 

34 

.8 

37 , 

.3 

39 

.8 

15 , 

.8 

10 

.1 

6 

430 . 

.0 

35 

.5 

38 , 

.0 

40 

5 

18 , 

.0 

11 

3 

6 

345 , 

.0 

36 

.0 

38 , 

.5 

41 

.0 

15 , 

. 6 

9 

.7 

6 

456 . 

.0 

40 

.0 

42 , 

.5 

45 

5 

16 , 

.0 

9 

5 

6 

510 , 

.0 

40 

.0 

42 , 

.5 

45 

.5 

15 , 

.0 

9 

.8 

6 

540 . 

.0 

40 

.1 

43 , 

.0 

45 

8 

17 , 

.0 

11 

2 

6 

500 , 

.0 

42 

.0 

45 , 

.0 

48 

.0 

14 , 

.5 

10 

.2 

6 

567 . 

.0 

43 

.2 

46 , 

.0 

48 

7 

16 , 

.0 

10 

0 

6 

770 , 

.0 

44 

.8 

48 , 

.0 

51 

.2 

15 , 

.0 

10 

.5 

6 

950 . 

.0 

48 

.3 

51 , 

. 7 

55 

1 

16 , 

.2 

11 

2 

6 

1250 , 

.0 

52 

.0 

56 , 

.0 

59 

. 7 

17 , 

. 9 

11 

. 7 

6 

1600 . 

.0 

56 

.0 

60 , 

.0 

64 

0 

15 , 

.0 

9 

6 

6 

1550 , 

.0 

56 

.0 

60 , 

.0 

64 

.0 

15 , 

.0 

9 

. 6 

6 

1650 . 

.0 

59 

.0 

63 , 

. 4 

68 

0 

15 , 

. 9 

11 

0 














7 

6 . 

. 7 

9 

.3 

9 , 

.8 
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Dan program untuk melakukan analisis diskriminan kanoniknya adalah : 


proc candisc data=fish ncan=6 out=outcan; 
class Species; 

var Weight Lengthl Length2 Length3 Height Width; 
title 'Analisis Diskriminan Kanonik data Ikan’; 
run; 


Pernyataan CLASS memerintahkan PROC CANDISC menggunakan 
SPECIES sebagai kelompok. Sedangkan pernyataan VAR menunjukkan 
peubah mana saja yang digunakan sebagai penjelas. 


PROC CANDISC akan menduga fungsi diskriminan kanonik. Fungsi 
diskriminan yang terbentuk sebanyak peubah penjelas atau banyaknya 
kelompok dikurangi satu, tergantung mana yang terkecil. 


Kali ini kita memiliki 6 peubah penjelas dan 7 kelompok. Sehingga akan 
ada 6 fungsi diskirminan kanonik. 


Fungsi ini berbentuk kombinasi linear dari peubah penjelas, dimana tiap 
koefisien yang terpilih telah memaksimumkan jarak antar rataan 
kelompok. 


Output dari PROC CANDISC adalah : 


Analisis Diskriminan Kanonik data Ikan 



The 

CANDISC 

Procedure 


Observations 158 


DF 

Total 

157 

Variables 

6 


DF 

Within Classes 

151 

Classes 

7 


DF 

Between Classes 

6 


Class 

Level 

Information 



Variable 





Species 

Name 

Frequency 

Weight 

Proportion 

Bream 

Bream 


34 

34.0000 

0.215190 

Parkki 

Parkki 


11 

11.0000 

0.069620 

Perch 

Perch 


56 

56.0000 

0.354430 

Pike 

Pike 


17 

17.0000 

0.107595 

Roach 

Roach 


20 

20.0000 

0.126582 

Smelt 

Smelt 


14 

14.0000 

0.088608 

Whitefish 

Whitefish 


6 

6.0000 

0.037975 


PROC CANDISC mendaftar banyaknya amatan di setiap kelompok, serta 
proporsinya. Kegunaan dari informasi ini akan dibahas kemudian. 
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Output selanjutnya adalah 


Analisis Diskriminan Kanonik data Ikan 
The CANDISC Procedure 

Multivariate Statistics and F Approximations 
S=6 M=-0.5 N=7 2 


Statistic 

Value 

F Value 

Num DF 

Den DF 

Pr > F 

Wilks' Lambda 

0.00036325 

90.71 

36 

643.89 

<.0001 

Pillai 1 s Trace 

3.10465132 

26.99 

36 

906 

<.0001 

Hotelling-Lawley Trace 

52.05799676 

209.24 

36 

413.64 

<.0001 

Roy's Greatest Root 

39.13499776 

984.90 

6 

151 

<.0001 


NOTE: F Statistic for Roy's Greatest Root is an upper bound. 


Uji diatas digunakan untuk menguji hipotesis nol bahwa semua korelasi 
kanonik adalah nol, yang berarti tidak ada fungsi linear yang bisa 
membedakan kelompok. Pada output di atas karena nilai p-nya kecil 
maka hipotesis nol ditolak. 

Korelasi kanonik adalah ukuran keeratan hubungan antara peubah 
penjelas dengan kelompok. 


Analisis Diskriminan Kanonik data Ikan 
The CANDISC Procedure 




Adjusted 

Approximate 

Squared 


Canonical 

Canonical 

Standard 

Canonical 


Correlation 

Correlation 

Error 

Correlation 

1 

0.987463 

0.986671 

0.001989 

0.975084 

2 

0.952349 

0.950095 

0.007425 

0.906969 

3 

0.838637 

0.832518 

0.023678 

0.703313 

4 

0.633094 

0.623649 

0.047821 

0.400809 

5 

0.344157 

0.334170 

0.070356 

0.118444 

6 

0.005701 


0.079806 

0.000033 



Test of H0: 

The canonical 

correlations in 


the current row and all 


Eigenvalues of Inv(E)*H that follow are zero 

= CanRsq/(l-CanRsq) 


Eigenvalue 

Difference 

Proportion 

Cumulative 

liikelihood Approximate 
Ratio F Value 

Num DF 

Den DF 

Pr > F 

39.1350 

29.3859 

0.7518 

0.7518 

0.00036325 

90.71 

36 

643.89 

<.0001 

9.7491 

7.3786 

0.1873 

0.9390 

0.01457896 

46.46 

25 

547.58 

<.0001 

2.3706 

1.7016 

0.0455 

0.9846 

0.15671134 

23.61 

16 

452.79 

<.0001 

0.6689 

0.5346 

0.0128 

0.9974 

0.52820347 

12.09 

9 

362.78 

<.0001 

0.1344 

0.1343 

0.0026 

1.0000 

0.88152702 

4.88 

4 

300 

0.0008 

0.0000 


0.0000 

1.0000 

0.99996749 

0.00 

% 

§51 

0.9442 


Banyaknya fungsi diskriminan kanonik yang PROC CANDISC hasilkan 
adalah yang terkecil antara derajat bebas kelompok (grup) dan derajat 
bebas peubah penjelas. Derajat bebas kelompok adalah banyaknya 
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kelompok dikurangi satu sedangkan derajat bebas peubah penjelas 
adalah banyaknya peubah penjelas. Dengan demikian, kita peroleh 6 
buah fungsi diskriminan kanonik. 


Perhatikan korelasi antara peubah-peubah penjelas dengan fungsi 
diskriminannya. Korelasi ini adalah korelasi bivariate antara setiap peubah 
dengan setiap fungsi diskriminan. 


Analisis Diskriminan Kanonik data Ikan 
The CANDISC Procedure 


Total Canonical Structure 


Variable 

Canl 

Can2 

Can3 

Can4 

Can5 

Can6 

Weight 

0.230560 

0.420828 

0.409512 

-0.117922 

-0.573797 

0.508819 

Lengthl 

0.102173 

0.670793 

0.490738 

-0.096086 

-0.295203 

0.449885 

Length2 

0.119374 

0.664922 

0.506495 

-0.094508 

-0.302814 

0.431814 

Length3 

0.222321 

0.665900 

0.484137 

-0.075323 

-0.298030 

0.422216 

Height 

0.763233 

0.131542 

0.484394 

-0.070361 

-0.197377 

0.348750 

Width 

0.240650 

0.273018 

0.696271 

0.104958 

-0.307330 

0.526581 


Matriks Total Canonical Structure memuat nilai korelasi antara peubah 
penjelas danfungsi diskriminan, tanpa pengkoreksian (penyesuaian) 
keanggotaan di setiap kelompok, sehingga ada kemungkinan terjadi 
kerancuan karena hal itu. 




Pooled 

Within Canonical Structure 


Variable 

Canl 

Can2 

Can3 

Can4 

Can5 

Can6 

Weight 

0.046034 

0.162357 

0.282143 

-0.115459 

-0.681453 

0.643590 

Lengthl 

0.025554 

0.324182 

0.423532 

-0.117850 

-0.439169 

0.712822 

Length2 

0.030163 

0.324651 

0.441629 

-0.117107 

-0.455129 

0.691230 

Length3 

0.057538 

0.333012 

0.432369 

-0.095598 

-0.458798 

0.692253 

Height 

0.243560 

0.081113 

0.533406 

-0.110109 

-0.374655 

0.705044 

Width 

0.052710 

0.115551 

0.526255 

0.112738 

-0.400405 

0.730679 


Sedangkan matriks Pooled Within Canonical Structure memuat nilai 
korelasi antara peubah penjelas dan fungsi diskriminan yang telah 
dikoreksi oleh informasi keanggotaan kelompok. 
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Dengan melihat lebih jauh terhadap nilai-nilai korelasi pada matriks di 
atas, variabel yang berkorelasi tinggi dengan fungsi diskriminan kanonik 
yang pertama adalah HEIGHT, yang menunjukkan bahwa peubah ini erat 
kaitannya dengan perbedaan spesies. Hal ini berarti bahwa pembeda 
utama dari spesies ikan-ikan di atas adalah TINGGI (HEIGHT) -nya. 

Selanjutnya, untuk fungsi diskriminan kanonk kedua, peubah-peubah 
yang berkorelasi tinggi adalah LENGTH1 (Panjang Tubuh), LENGTH2 
(Panjang Kepala), dan LENGTH3 (Panjang ekor). Peubah yang 
berhubungan dengan dimensi panjang anatomi inilah yang membentuk 
fungsi diskriminan kanonik yang kedua. 


PROC CANDISC juga menghasilkan koefisien mentah dan koefisien baku 
penyusun fungsi diskriminan kanonik dari semua peubah, hanyasaja 
interpretasi terhadapnya cukup sulit. Koefisien mentah dipengaruhi oleh 
skala dari peubah dan korelasi antar peubah. Sedangkan koefisien baku 
dipengaruhi oleh korelasi antar peubah penjelas. 


Analisis Diskriminan Kanonik data Ikan 
The CANDISC Procedure 


Total-Sample Standardized Canonical Coefficients 


Variable 

Canl 

Can2 

Can3 

Can4 

Can5 

Can6 

Weight 

Lengthl 

Length2 

Length3 

Height 

Width 

-0.23287040 

-3.30254226 

-26.71741394 

30.20558626 

4.80387980 

-2.44489997 

-1.87861652 
-6.28154797 - 

-7.41786401, 
20.98357040 - 

-3.06026678 
-1.53319065 

-2.00951527 

29.41614257 

43.47030076 

13.25763695 

1.21255849 

'1.25337213 

-0.32882654 

-4.51389540 

-18.12471382 

21.95619508 

-4.18217355 

4.20224089 

-2.79547487 

18.02442316 

-13.47860874 

-3.19757135 

1.49325385 

-0.07023681 

0.28003904 

32.99160100 

-32.79775341 

-1.08873008 

0.72765559 

0.69169212 


Pooled Within-Class 

Standardized 

Canonical Coefficients 


Variable 

Canl 

Can2 

Can3 

Can4 

Can5 

Can6 

Weight 

Lengthl 

Length2 

Length3 

Height 

Width 

-0.18772539 

-2.12531351 

-17.01855083 

18.78500902 

2.42294578 

-1.79661023 

-1.51442189 

-4.04241874 

-4.72505670 

13.04979006 

-1.54351499 

-1.12664977 

-1.61994419 

-18.93042395 

27.68986268 

-8.24499242 

0.61158138 

0.92102794 

-0.26507917 

-2.90486604 

-11.54514296 

13.65467033 

-2.10937412 

3.08797458 

-2.25353514 

11.59941250 

-8.58565086 

-1.98858602 

0.75315646 

-0.05161281 

0.22574977 

21.23136955 

-20.89162652 

-0.67708682 

0.36700961 

0.50828302 



Raw 

Canonical Coefficients 



Variable 

Canl 

Can2 

Can3 

Can4 

Can5 

Can6 

Weight 

Lengthl 

Length2 

Length3 

Height 

Width 

-0.000648508 

-0.329435762 

-2.486133674 

2.595648437 

1.121983854 

-1.446386704 

-0.005231659 

-0.626598051 

-0.690253987 

1.803175454 

-0.714749340 

-0.907025481 

-0.005596192 

-2.934324102 

4.045038893 

-1.139264914 

0.283202557 

0.741486686 

-0.000915731 

-0.450270868 

-1.686557742 
1.886755746 
-0.976779477 

2.486018007 

-0.007784969 

1.797975352 

-1 .254224048 
-0.274776030 
0.348761164 

-0.041551633 

0.000779866 

3.290983844 

-3.051927082 

-0.093557546 

0.169949677 

0.409200496 
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Yang perlu juga adalah pembahsan mengenai rata-rata kelompok dari 
setiap fungsi diskriminan kanonik yang terbentuk. Ruang yang dibentuk 
oleh fungsi-fungsi ini merupakan ruang yang memaksimumkan jarak 
antara centroid-centroid kelompok. 




Class Means 

on Canonical 

Variables 



Species 

Canl 

Can2 

Can3 

Can4 

Can5 

Can6 

Bream 

10.94142464 

0.52078394 

0.23496708 

-0.07271487 

-0.17753724 

0.00207811 

Parkki 

2.58903743 

-2.54722416 

-0.49326158 

-1.65865810 

0.87343845 

-0.00814569 

Perch 

-4.47181389 

-1.70822715 

1.29281314 

-0.09241115 

-0.07247807 

0.00237500 

Pike 

-4.89689441 

8.22140791 

-0.16469132 

-0.48831679 

0.01971053 

-0.00057099 

Roach 

-0.35837149 

0.08733611 

-1.10056438 

1.63915159 

0.51514591 

0.00168629 

Sme 11 

-4.09136653 

-2.35805841 

-4.03836098 

-0.44067181 

-0.47039121 

0.00070315 

Whitefish 

-0.39541755 

-0.42071778 

1.06459242 

1.26338797 

-0.59421743 

-0.02465266 


Nampaknya, fungsi diskriminan yang pertama memisahkan ikan BREAM 
dan PARKKI dengan ikan lainnya. Sedangkan fungsi diskriminan kanonik 
yang kedua memisahkan ikan PIKE. 


Apa yang sudah kita pelajari sejauh ini ? 


Nampaknya ada suatu fungsi diskriminan linear dari peubah-peubah 
penjelas yang secara signifikan memisahkan spesies ikan. Nampaknya 
fungsi-fungsi diskriminan tersebut bisa diintrepretasikan. Kita masih 
membutuhkan cara untuk menilai seberapa bagus kemampuan fungsi 
tersebut memprediksi keanggotaan dari suatu objek berdasarkan peubah 
yang diamati. Untuk itu kita gunakan PROC DISCRIM. PROC CANDISC 
berguna untuk menilai derajat atau tingkat kemampuan peubah 
membedakan antar kelompok. 
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10.8. Latihan 


1. Data berikut merupakan hasil pengukuran empat peubah 
yang merupakan karakteristik dari dua spesies kutu serangga 
yaitu haltica oleracea dan haltica carduorum. 



Haltica 

olenicea 




llaltica carduorum 



No. 

Vi 

V’2 

V’3 

V4 

No. 

V| 

V’2 

V’3 

V4 

1 

189 

245 

137 

163 

1 

181 

305 

184 

209 

2 

192 

260 

132 

217 

2 

158 

237 

133 

188 

3 

217 

276 

141 

192 

3 

184 

300 

166 

231 

4 

221 

299 

142 

213 

4 

171 

273 

162 

213 

5 

171 

239 

128 

158 

3 

181 

297 

163 

224 

6 

192 

262 

147 

173 

6 

181 

308 

160 

223 

7 

213 

278 

136 

201 

7 

177 

301 

166 

221 

8 

192 

255 

128 

185 

8 

198 

308 

141 

197 

9 

170 

244 

128 

192 

9 

180 

286 

146 

214 

10 

201 

276 

146 

186 

10 

177 

299 

171 

192 

II 

195 

242 

128 

192 

11 

176 

317 

166 

213 

12 

205 

263 

147 

192 

12 

192 

312 

166 

209 

13 

180 

252 

121 

167 

13 

176 

285 

141 

200 

14 

192 

283 

138 

183 

14 

169 

287 

162 

214 

15 

200 

294 

138 

188 

15 

164 

265 

147 

192 

16 

192 

277 

150 

177 

16 

181 

308 

157 

204 

17 

200 

287 

136 

173 

17 

192 

276 

154 

209 

18 

181 

255 

146 

183 

18 

181 

278 

149 

235 

19 

192 

287 

141 

198 

19 

175 

271 

140 

192 






20 

197 

303 

170 

205 


a. Carilah koefisien fungsi diskriminannya 

b. Carilah koefisien bakunya 

c. Hitung uji-t untuk peubah individu 
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11 


ll.Analisis Biplot (Biplot Analysis ) 


11.1. Pendahuluan 


Dalam Analisis Mutivariat terdapat banyak metode yang dapat 
digunakan untuk menyelesaikan masalah atau mengolah data yang 
melibatkan banyak variabel. Misalnya pada saat melakukan suatu 
penelitian, data yang diperoleh adalah rekapan data yang berupa tabel 
nilai rata-rata dari beberapa peubah/variabel pada beberapa objek. 
Semakin banyak peubah yang diukur dan semakin banyak objek yang 
diamati, maka ukuran tabel yang dimiliki akan semakin besar dan semakin 
sulit untuk menginterpretasikannya. Untuk itu diperlukan suatu metode 
yang mampu mempermudah interpretasi dari data yang dimiliki. Metode 
Mutivariat yang dapat digunakan untuk mengatasi masalah tersebut 
salah satunya adalah biplot. 

Biplot adalah salah satu upaya menggambarkan data -data yang ada 
pada tabel ringkasan dalam grafik berdimensi dua. Informasi yang 
diberikan oleh biplot mencakup objek dan peubah dalam satu gambar 
(Sartono dkk, 2003). Analisis biplot bersifat deskriptif dengan dimensi dua 
yang dapat menyajikan secara visual segugus objek dan variabel dalam 
satu grafik. Grafik yang dihasilkan dari biplot ini merupakan grafik yang 
berbentuk bidang datar. Dengan penyajian seperti ini, ciri-ciri variabel 
dan objek pengamatan serta posisi relatif antara objek pengamatan 
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dengan variabel dapat dianalisis (Jollife (1986) dan Rowling (1988) dalam 
Sartono dkk, 2003). 

Tiga hal penting yang bisa didapatkan dari tampilan biplot adalah 
(Sartono dkk, 2003): 

1. Kedekatan antar objek yang diamati 

Informasi ini dapat dijadikan panduan untuk mengetahui objek yang 
memiliki kemiripan karakteristik dengan objek lain. Penafsiran ini mungkin 
akan berbeda untuk setiap bidang terapan, namun inti dari penafsiran ini 
adalah bahwa dua objek yang memiliki karakteristik sama akan 
digambarkan sebagai dua titik dengan posisi yang berdekatan. 

2. Keragaman peubah 

Informasi ini digunakan untuk melihat apakah ada variabel yang 
mempunyai nilai keragaman yang hampir sama untuk setiap objek. 
Dengan informasi ini, bisa diperkirakan pada variabel mana strategi 
tertentu harus ditingkatkan, dan juga sebaliknya. Dalam biplot, variabel 
yang mempunyai nilai keragaman yang kecil digambarkan sebagai 
vektor pendek sedangkan variable dengan nilai keragaman yang besar 
digambarkan sebagai vektor yang panjang. 

3. Korelasi antar peubah 

Dari informasi ini bisa diketahui bagaimana suatu variabel mempengaruhi 
ataupun dipengaruhi variabel yang lain. Pada biplot, variabel akan 
digambarkan sebagai garis berarah. Dua variabel yang memiliki nilai 
korelasi positif akan digambarkan sebagai dua buah garis dengan arah 
yang sama atau membentuk sudut sempit. Sementara itu, dua variabel 
yang memiliki nilai korelasi negatif akan digambarkan dalam bentuk dua 
garis dengan arah yang berlawanan atau membentuk sudut lebar 
(tumpul). Sedangkan dua variabel yang tidak berkorelasi akan 
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digambarkan dalam bentuk dua garis dengan sudut yang mendekati 90° 
(siku-siku). 

4. Nilai peubah pada suatu objek 

Dalam informasi ini digunakan untuk melihat keunggulan dari setiap objek. 
Objek yang terletak searah dengan arah vektor variabel dikatakan 
bahwa objek tersebut mempunyai nilai di atas rata-rata. Namun jika objek 
terletak berlawanan dengan arah dari vektor variabel tersebut, maka 
objek tersebut memiliki nilai di bawah rata-rata. Sedangkan objek yang 
hampir berada ditengah-tengah berarti objek tersebut memiliki nilai dekat 
dengan rata -rata. 

Perlu dipahami sebelumnya bahwa biplot adalah upaya membuat 
gambar di ruang berdimensi banyak menjadi gambar di ruang berdimensi 
dua. Pereduksian dimensi ini mengakibatkan menurunnya informasi yang 
terkandung dalam biplot. Biplot yang mampu memberikan informasi 
sebesar 70% dari seluruh informasi dianggap cukup. 

11.2. Penguraian Nilai Singular (Singular Value Decomposition) 

Analisis biplot pertama kali diperkenalkan oleh Gabriel (1971). Analisis ini 
didasarkan pada Singular Value Decomposition (SVD). Biplot dapat 
dibangun dari suatu matriks data, dengan masing-masing kolom mewakili 
suatu variabel, dan masing-masing baris mewakili objek penelitian (Udina: 
2005). 



\Xu 

X\2 

■■ X lp l 

X = 

X 2 i 

X 22 

" X 2 p 


Xm 

Xm ■ 

■■ x np _ 


Matriks X adalah matriks yang memuat variabel-variabel yang akan diteliti 
sebanyak p dan objek penelitian sebanyak n. Pendekatan langsung untuk 
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mendapatkan nilai singularnya, dengan persamaan yang digunakan 
adalah matriks X berukuran nxp yang berisi n objek dan p variabel yang 
dikoreksi terhadap rata-ratanya dan mempunyai rank r, dapat dituliskan 
menjadi 




,U rr LA' 


dengan (r <{n,p}) 

U dan A adalah matriks dengan kolom ortonormal ( U’U=A’A=I r ) dan L 
adalah matriks diagonal berukuran (rxr) dengan unsur-unsur diagonalnya 
adalah akar dari nilai eigen-nilai eigen XX yaitu y^ > > ••• > 

Unsur - unsur diagonal matriks L ini disebut nilai singular matriks X dan 
kolom-kolom matriks A adalah vektor eigen dari XX Kolom-kolom untuk 
matriks U diperoleh dari Ui=^=a if i=l,2,....r dengan u t adalah kolom 

V M 

mariks U, a t adalah kolom matriks A dan adalah nilai eigen ke-i. 

Unsur-unsur diagonal matriks L merupakan nilai singular dari matriks X. 
Kemudian didefinisikan L a dengan 0 < a < 1 adalah matriks diagonal 
berukuran rxr dengan unsur-unsur diagonalnya > Jhf > ••• > y[x^, 
dan definisi ini berlaku pula untuk L 1 ~ a dengan unsur-unsur digonalnya 

adalah > Ja^~“ > - > 

Menurut Jollife (1986),misalkan G = UL a dan H' = L x ~ a A' dengan a 
besarnya 0 < a < 1. Persamaan di atas menjadi 

X = UL a L la A = GH' 

Hal ini berarti unsur ke-(/J) matriks X dapat dituliskan sebagai: 

x ij = SI i j 
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dengan g i = 1 , 2 ,..., n dan , / , i = 1 , 2 ..., p masing-masing merupakan 
baris matriks G dan kolom matriks H. Pada g t dan mempunyai r dimensi. 
Jika X mempunyai rank dua, vektor baris g t dan vektor dapat 
digambarkan dalam ruang berdimensi dua. Jika X mempunyai rank lebih 
dua maka persamaan di atas menjadi 

x ij = ^k=l U ik\^ a jk 

dengan u ik adalah elemen ke-(/,k) dari matriks U, a jk adalah elemen ke- 

1 

(i,k) dari matriks A dan adalah elemen diagonal ke-k dari matriks L. 

Himpunan data asal yang terdiri dari n objek dan p variabel tereduksi 
menjadi himpunan data yang terdiri dari n objek dengan m unsur 
pertama. Jika ada sebanyak m elemen unsur yang dipertahankan, 
persamaan di atas dapat didekati dengan 

m x ij = ^k =1 U ik\^ a jk m < r 
r.. - Y m u i a 2 i l ~ a 2sy 

m Xl J u ik ^k ^ ^k ^ U jk 


~ Yk=idikjk 

Dengan g/dan /masing-masing berisi elemen unsur vektor g t dan j 
Gabriel (1971) menyatakan m = 2 disebut biplot, sehingga persamaan 
yang terakhir dapat dinyatakan sebagai 

2 x a = gC'j* 
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Dengan 2 x tj merupakan unsur pendektan matriks X pada dimensi dua, 
sedangkan gC' dan f masing -masing mengandung dua unsur pertama 
vektor g t dan 7 -. 

Dari pendekatan matriks X pada dimensi dua diperoleh matriks G dan H 
sebagai berikut 



9u 

9l2' 


Tin 

h 12 ~ 

G = 

9il 

9i2 

dan H = 

h;i 

h i2 


-9nl 

9n2- 


-h p i 

hp 2 - 


Matriks G adalah titik-titik koordinat dari n objek dan matriks H adalah titik- 
titik koordinat dari p variabel. 

Gabriel (1971) mengemukakan ukuran pendekatan matriks X dengan 
biplot dalam bentuk: 


2 _ ( 7 - 1 +^ 2 ) 

P ZUAfc 

dengan A ± adalah nilai eigen terbesar ke-1, A 2 adalah nilai eigen terbesar 
ke-2 dan A k ,k =1,2....r adalah nilai eigen ke-k. Apabila p 2 mendekati nilai 
satu, maka biplot memberikan penyajian yang semakin baik mengenai 
informasi data yang sebenarnya . 

Menurut Jollife (1986) untuk mendeskripsikan biplot perlu mengambil nilai a 
dalam mendefinisikan G dan H.Pemilihan nilai a pada G = UL a dan 
H' = L 1 ~ a A' bersifat sembarang dengan syarat 0 <a< 1. Pengambilan nilai 
ekstrim a=0 dan a=l berguna dalam interpretasi biplot. 
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Jika a=0 didapat G = UL° = U dan H' = L 1 A' =LA’ sehingga 


XX = (GH'y(GH') 
= HG'GH’ 

= HU'UH' 


= HH A ' 


Matriks U ortonormal dan X’X = (n-l)S dengan n adalah banyaknya objek 
pengamatan dan S adalah matriks kovarian dari matriks X maka 

HH’=(n-l) S 

Hasil kali h/ hj adalah akan sama dengan (n-1) kali kovarian % antara 
variabel ke-j dan variabel ke-k. Selanjutnya untuk mengetahui variansi 
variabel digunakan matriks H. 


/lll 

hi2 

/lu 

■■ hpi 

hpi 

hp2 

Al.2 

■■ hp 2 _ 


Jih + h\ 2 ... huhpi + /li2^p2l 

huhpi + h 12 hp 2 hpi + hp 2 J 

Diagonal utama pada matriks HH’: h^+h^ , ... , hf ± + hf 2/ ..., hp ± + hp 2 
menggambarkan variansi dari variabel. Sedangkan hj ± + hf 2 , j= 
menyatakan panjang vector variabel (dengan jarak Euclid dari titik 
0(0,0)). Sehingga dapat disimpulkan bahwa panjang vector variabel 
sebanding dengan variansi variabel. 

Nilai cosinus sudut antara dua vektor peubah menggambarkan korelasi 
kedua peubah. Semakin sempit sudut yang dibuat antara dua variabel 
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maka semakin tingggi korelasinya. Korelasi peubah ke-/ dan ke-k sama 
dengan nilai cosinus sudut vektor hj dan hk . 


S j. k \hj 11 hk I co s 0 


S j- k _ Sjk _ Sjk 

N\h k \ JS^JSkk S j Sk 


r Jk 


Kedekatan antar obyek pada gambar biplot dapat dilihat dengan 
menggunakan jarak Euclid antara #*dan g j sebanding dengan jarak 
Mahalanobis antar objek pengamatan x*d an xj dalam data 
pengamatan sesungguhnya. 

Jarak Mahalanobis antara dua pengamatan x t dan xj didefinisikan 
sebagai: 


S 2 (xiXj') = ( Xi~Xj)S 1 (x i —Xj) 

Jarak Euclid antara dua pengamatan g t dan g j didefinisikan sebagai: 
d 2 (g t ,gi) = (g i - g j) (gt - g j) 

Menurut Jollife (1986) S 2 {xipcj) = (n - l') 2 d 2 {g t g j). Hal ini dapat dibuktikan 
sebagai berikut: Persamaan yang ketiga di atas dapat ditulis kembali 
sebagai x-= giH, i = 1,2, ...,n dan disubsitusikan ke dalam persamaan 
sehingga menghasilkan: 

8 2 (x u Xj) =(H gi - Hgj)S-\H gi - Hgj) 

= (H(g i -g j )) S- 1 H(g i - 9j ) 

= (gi-g i )HS- 1 H(g i -gj) 

= (n - i)(gi ~ g j) {LA)' {XX) 1 {LA) {g i - g j) 
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Dengan H' = LA [(a = 0) dan S -1 = (n - 1 )(X'X )~ 1 


Sedangkan 

X’X = (ULA’)'(ULA)’ 
= ALU’U LA’ 


= AL 2 A’ 


dan 


(X'X) _1 = ((ULA) (ULA'))- 1 
= ( U'LAULA'y 1 
= (ALU ULA )- 1 


= AL ~ 2 A’ 


Subsitusikan persamaan (12) dan (13) ke persamaan (11) menghasilkan 
S 2 (xtXj) = (n - 1 y(gi.g j )\LAXX'xr 1 LA(g i ,g j ) 


= (n-l) 2 (g i: gj)L(AA)L 2 (AA)L(g i g j ) 

= (n-Y) 2 (g u g j ')LL- 2 L(g ii g j ), (A adalah ortogonal) 


= (n-V 2 (g i,g j) (g i,g j) 


= (n-l) 2 d 2 (g u gj). 


Berarti dapat dilihat bahwa Mahalanobis sebanding dengan jarak Euclid. 
Hal ini menunjukkan bahwa jarak Euclid mampu menggambarkan posisi 
objek pengamatan dalam data pengamatan sesungguhnya. Jika a=l 
maka G-UL dan H=A sehingga diperoleh : 

XX’ = (GH’)(GH’)’ 
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= GH’HG’ 


= G A’AG’ 

= GG’ 

Pada keadaan ini, jarak Euclid antara g t dan gj akan sama dengan jarak 
Euclid antara objek pengamatan x t dan x 7 -.Vektor baris ke-i sama dengan 
skor komponen utama untuk responden ke-i dari hasil analisis komponen 
utama. Untuk G = UL maka unsur ke-k dari g t adalah u ik JJ^ . Hasil 
tersebut sama dengan Z ik yang merupakan skor komponen utama ke-k 
dari objek ke-i. Sedangkan H=A diperoleh bahwa vektor pengaruh kolom 
hj sama dengan aj. 


11.3. Ilustrasi 

Data yang digunakan merupakan hasil pengamatan mahasiswa 
holtikultura Jurusan Budi Daya pertanian IPB (Nitrisari, 2002). Tidak semua 
variabel digunakan, karena mengakibatkan matriks X'X yang tidak definit 
positif. 

Peubah pengamatan buah nenas gueen disajikan pada tabel berikut: 


No 

Peubah 

Uraian 

Satuan 

1 

X/ 

Kodor Air 

% 

2 

X 2 

Vitamin C 

Mg/WOgr 

3 

X 3 

Suckers 

Tangkai 

4 

X 4 

Shoots 

Tangkai 

5 

Xs 

Jumlah daun 

Helai 


Analisis Biplot dilakukan sebanyak dua kali, untuk mengetahui posisi relatif 
antara lokasi tanam dengan setiap peubah pengamatan, dengan cara 
mengamati posisi vektor yang mewakili peubah, ragam serta korelasi 
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antar peubah. Analisis Biplot pertama dilakukan untuk melihat posisi relatif 
antara lokasi tanam dengan peubah kualitas buah yang menyangkut 
kandungan kimia dan morfologi buah. Analisis Biplot yang kedua 
dilakukan untuk melihat posisi relatif antara lokasi tanam dengan setiap 
peubah morfologi tanaman. 

Data Kualitas Buah dan morfologi Tanaman Nenas 


Lokasi 

X/ 

X 2 

x 3 

X 4 

X 5 

Cipelang 

84.09 

9.014 

2.5 

3 

28 

Sukaharja 

81.54 

9.008 

1.5 

6 

38.5 

Tajur Halang 

83.58 

9.55 

2 

4 

36.5 

Sukaluyu 

83.79 

8.263 

1 

9 

31 


Tahapan membuat biplot: 

1. Cari nilai X’X 



'27726.2802 

2983.04535 

583.485 

1829.94 

11141.97 

X'X= 

2983.04535 

321.875929 

63.41 

193.657 

1203.928 

583.485 

63.41 

13.5 

33.5 

231.75 


1829.94 

193.657 

33.5 

142 

740 


11141.97 

1203.928 

231.75 

740 

4559.5 


2. Cari nilai eigen dari X’X 

Nilai eigen yang diperoleh adalah 0.1108921790 10-5, 0.02160697849, 
22.59176143, 70.93554727, dan 32669.6072. Matriks L diperoleh dengan 
menggunakan rumus dimana merupakan nilai diagonal ke-i dan 

A x > A 2 > ••• ^ A 5 


l ± = V32669.6072 = 180.7435 
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Dengan menggunakan program SAS 6.12 dapat diperoleh matrik U, L, dan 
A. Output yang diperoleh adalah 

'0.4922259 -0.664929 -0.464025 -0.316644 0" 

.j = 0.501689 0.6248001 0.0440133 -0.596654 0 

0.5076557 0.3002489 -0.378514 0.7133468 0 

.0.4983046 -0.278109 0.7996693 0.1867541 0. 

rl80.74736 0 0 0 0- 

0 8.4223 0 0 0 

L= 0 0 4.753 0 0 

0 0 0 0.14699 0 

-0 0 0 0 0.00105- 

0.9210746 -0.377051 -0.013237 -0.055054 -0.079044- 

0.0991535 0.0242083 -0.166921 0.8621129 0.4674197 

A = 0.0193459 -0.047817 -0.221204 -0.497593 0.8371433 

0.0608705 0.0536703 0.9583207 0.0293804 0.2723463 

-0.3710938 0.9230815 -0.068207 -0.072582 -0.017015- 


3. Cari nilai G dan H 


Apabila digunakan a = 0, maka G = U dan H’ p LA’. Matrik G dan H’ yang 
diperoleh adalah sebagai berikut: 

'0.4922259 -0.664929 -0.464025 -0.316644 0' 

r = 0.501689 0.6248001 0.0440133 -0.596654 0 

0.5076557 0.3002489 -0.378514 0.7133468 0 

.0.4983046 -0.278109 0.7996693 0.1867541 0. 

- 166.4818 17.92173 3.49672 11.00218 67.07422 - 

-3.17565 0.20389 -0.40273 0.452029 7.774492 

/T = -0.06292 -0.79339 -1.0514 4.554973 -0.32419 

-0.00809 0.126725 -0.07314 0.004319 -0.01067 

—8.3 10" 5 0.000491 0.000879 0.000286 -1.8 10" 5 - 
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Dari pendekatan matriks X pada dimensi dua, matriks G dan H yang 

diperoleh adalah sebagai berikut: 

0.492 -0.665 - 

G * = 0.502 0.625 

0.508 0.300 
1-0.498 -0.278-1 


T 166.4818 17.92173 3.49672 11.00218 67.074221 
I--3.17565 0.20389 -0.40273 0.452029 7.774492J 


Matriks G merupakan titik koordinat dari empat objek dan matrik H 
merupakan titik koordinat dari 5 variabel. 


4. Gambar biplotnya 


Berdasarkan nilai dari matriks G dan H selanjutnya digunakan untuk 
membuat grafik Biplot. Grafik yang diperoleh seperti berikut ini. 



Dari gambar biplot tersebut, kita tidak dapat secara jelas melihat sebaran 
data di objek. Untuk mempermudah melihat sebaran data objek, nilai 
koordinat objek dikalikan dengan konstanta, misalnya 10, sehingga 
diperoleh gambar seperti berikut ini. 
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Dari grafik dapat dilihal bahwa posisi relative dari Sukaraja berdekatan 
dengan Tajur Halang. Hal ini dapat diartikan bahwa karakteristik dari buah 
nanas yang dihasilkan di Sukaraja relative sama dengan buah nanas 
yang dihasilkan di Tajur Halang. Karakteristik dari buah nanas di Sukaraja 
dan Tajur Halang dicirikan oleh variabel X5, dalam hal ini jumlah daun. 
Sedangkan hasil buah nanas di Sukaluyu dan Cipelang kuat dicirikan oleh 
variabel XI, yaitu kadar airnya. 

5. Menghitung ukuran kebaikan biplot dan karakteristik lainnya 
Ukuran kebaikan biplot 

, (A!+A 2 ) (32669.6072 + 70.93554727) 32740.54 

o 2 = — -— =-----=-= n 9993 

Zl-ih 0.1108921790 10“ 5 + ... + 32669.6072 32763.156 
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Karena nilai p 2 yang diperoleh mendekati nilai 1, berarti biplot yang 
dihasilkan sangat baik. Informasi yang diberikan oleh biplot sebesar 99.93 
% dari keseluruhan informasi yang terkandung dalam data. 


Matriks varian covarian dari variabel 


S = H'H 


' 32669.61 -9.8478410“ 5 -0.00016 

-9.810“ 5 70.93554435 8.07 10“ 6 

-0.00016 8.0746610 -6 22.59175 

-1.2 10“ 6 -4.81095 10“ 7 7.24 10“ 9 

-2.6 10“ 8 4.4477 lO” 10 1.67 10“ 9 


-1.18417 10“ 6 
-4.81095 10“ 7 
7.23639 10“ 9 
0.021606995 
3.41631 10” 11 


-2.5895 10“ 8 ' 
4.4477 10“ 10 
1.66748 10“ 9 
3.4163110” 11 
1.1025 10“ 6 - 


Dengan menggunakan matriks varian kovarian, dapat dihitung besar 
korelasi antar variabel dengan menggunakan rumus: r ik = 

1 SjSk 


r 12 = 


5,5, 


-9.8 10“ 5 
V32669.6lV70.935 


= -6.4376 10“ 8 


r 13 =-1.862 10- 7 
r 14 = -4.4567 10' 8 
r 15 =-1.3642 1 O' 4 
r 23 = 2.0 1 59 lO 7 
r 24 =-3.8857 10“ 7 
r 25 =5.0294 10' 5 
r 34 = 1.0357 lO' 8 
r 3S = 3.34 1 O' 4 
r 45 = 2.213 10- 4 


Nilai korelasi antar variabel sangat kecil, sehingga hubungan yang dimiliki 
juga sangat lemah. Atau bisa dikatakan kelima variabel tersebut saling 
bebas. 


Jarak Euclid 


G G' = 


1 2.5110“ 7 5.77 10“ 8 5.73 10” 1 

2.51 10“ 7 1 -4.86 lO -8 -9.05 10 

5.77 lO -8 _ 4 86 10 —s x _3 37 io 
.5.73 IO -8 —g Q 5 lo-s _ 3i37 iq-7 


-8 

-7 

1 . 
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Jarak objek Cipelang dengan Sukaharja sebesar 2.5110 -7 , jarak objek 
Cipelang dengan Tajur halang sebesar 5.77 10 -8 , jarak objek Cipelang 
dengan objek Sukaluyu sebesar 5.73 10 -8 , jarak objek Sukaharja dengan 
objek Tajur halang sebesar 4.86 10 -8 , dan jarak objek Tajur halang 
dengan objek Sukaluyu sebesar 3.37 10 -7 . 


11.4. Aplikasi SAS 

Untuk analisis biplot, SAS tidak menyediakan suatu prosedur tersendiri 
namun melalui program makro %BIPLOT yang telah tersedia dalam SAS. 

Analisis biplot dapat diterapkan pada data yang minimal memiliki skala 
pengukuran interval. Namun demikian penerapan untuk data ordinal 
telah cukup memuaskan. Artinya mampu mewakili keadaan sebenarnya. 

Sebagai input untuk makro %BIPLOT adalah matriks rataan, yaitu matriks 
yang berisi rataan dari setiap peubah pada setiap objek, atau matriks 
data dari n objek dan p peubah itu sendiri. 

Sebagai ilustrasi sebagai berikut: 

Dilakukan survey untuk mengetahui karakteristik teh yang disukai oleh 
konsumen. Terdapat 6 merk teh dan responden diminta untuk 
memberikan penilaian terhadap 9 atribut untuk masing-masing merk teh 
tersebut. 

Rata-rata nilai untuk masing-masing atribut pada masing-masing merk teh 
sebagai berikut: 
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sosro 

Javati 

6138 

Kepala jenggot 

Peko 

super 

Pucuk 

hola 

Javati 

Ukuran kemasan 

1.3115 

-.2131 

.9508 

-.2397 

.1803 

0.0165 

Desain kemasan 

.6803 

-.2787 

.5328 

-.4463 

-.3033 

- 0.0492 

Harga 

1.6557 

-.9098 

1.2377 

-.6803 

-.7541 

-.7377 

Merk 

1.3279 

-.2975 

.8607 

-.1639 

- 0 . 090 ™ 

-.2869 

Warna seduhan 

1.1750 

0.0248 

.8595 

0.0749 

0.0413 

0.0246 

Variasi rasa 

1.2623 

0.0738 

.8197 

-.1066 

- 0.0328 

.1639 

Khasiat 

1.4918 

-.1721 

.6967 

-.1393 

- 0.0902 

0.0820 

Aroma 

1.5164 

-.2213 

.5574 

-.1885 

-.1074 

- 0.0328 

Kepraktisan 

1.1885 

- 0.041 

.8607 

-.1803 

-.1230 

.1967 


Sebaiknya penulisan atribut dan merk tidak terlalu panjang sehingga 
mudah dilihat pada biplot. 

Program macro Biplot sudah tersedia di SAS, tinggal dijalankan saja. 
Namun demikian setiap akan menjalankan macro Biplot ini maka macro 
Biplot harus ada di window program editor. Kalau tidak ada maka macro 
biplot tidak akan jalan. Untuk input data dan perintah running diletakkan 
di bawah program macro biplot. 


Program macro biplot tersebut sebagai berikut: 


Name: BIPLOT.SAS 

Title: Construct a biplot of observations and variables 
Uses IML. 

Doc: http://www.math.yorku.ca/SCS/sssg/biplot.html 


* Author: Michael Friendly <friendly@yorku.ca> * 

* Created: 1 Mar 1989 13:16:36 * 

* Revised: 22 Jul 1998 11:08:14 * 

* Version: 1.6 * 

* 1.5 Added dimension labels, fixed problem with dim=3, * 

* Added colors option, Fixed problem with var=_NUM_ * 

* 1.6 Added power transformation (for log(freq)) * 

* Added point symbols, marker styles (interp=) * 

* Made ID optional, can be char or numeric * 

* Fixed bug introduced with ID * 

* From SAS System for Statistical Graphics, First Edition'' * 

* Copyright(c) 1991 by SAS Institute Inc., Cary, NC, USA * 

* - */ 


%macro BIPLOT ( 

data=_LAST_, /* Data set for biplot */ 
var =_NUM_, /* Variables for biplot */ 
id =ID, /* Observation ID variable */ 
dim =2, /* Number of biplot dimensions */ 
factype=SYM, /* Biplot factor type: GH, SYM, or JK */ 
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scale=l, /* Scale factor for variable vectors */ 

power=l, /* Power transform of response */ 

out =BIPLOT, /* Output dataset: biplot coordinates */ 

anno=BIANNO, /* Output dataset: annotate labels */ 

xanno=diml, 
yanno=dim2, 
zanno=dim3, 


std=MEAN, /* How to standardize columns: NONE|MEAN|STD*/ 


colors=BLUE RED, /* Colors for OBS and VARS */ 
symbols=none none, /* Symbols for OBS and VARS */ 
interp=none vec, /* Markers/interpolation for OBS and VARS */ 
pplot=NO, /* Produce printer plot? */ 
gplot=YES, 

haxis=, /* AXIS statement for horizontal axis */ 


vaxis=, /* and for vertical axis- use to equate axes */ 

name=biplot); 

%let std=%upcase(&std) ; 

%let factype=%upcase(&factype); 

%if &factype=GH %then %let p=0; 

%else %if &factype=SYM %then %let p=.5; 

%else %if &factype=JK %then %let p=l; 

%else %do; 

%put BIPLOT: FACTYPE must be GH, SYM, or JK. "&factype" is not valid.; 
%goto done; 

%end; 

%if %upcase("&var") A = "_NUM_" %then %let var={&var}; 

%if &data=_LAST_ %then %let data=&syslast; 

proc iml; 

start biplot(y,id,vars,out, g, scale); 

N = nrow(Y); 

P = ncol(Y); 

%if &std = NONE 

%then Y = Y - Y[:] %str(;); 

%else Y = Y - J(N,1,1)*Y[:,] %str (; ); 

%if &std = STD %then %do; 

S = sqrt(Y[##,] / (N-l)); 

Y = Y * diag (1 / S ) ; 

%end; 

Singular value decomposition: 

Y is expressed as U diag(Q) V prime 
Q contains singular values, in descending order; 
call svd(u,q,v,y); 

reset fw=8 noname; 
percent = 100*q##2 / q[##]; 
cum = cusum(percent); 
cl={'Singular Values'}; 
c2={'Percent'}; 
c3={'Cum % '}; 

Print "Singular values and variance accounted for",, 
q [colname=cl format=9.4 ] 

percent [colname=c2 format=8.2 ] 
cum [colname=c3 format=8.2 ]; 

d = &dim ; 

Assign macro variables for dimension labels; 
lab = '%let p' + char(t(1:d),1) + '=' + 

left(char(percent[t(1:d)],8,1)) + 
call execute(lab); 

/* 

call execute('%let pl=', char(percent[1],8,1), ';'); 

call execute ('%let p2=', char(percent[2],8,1), ';'); 


/* remove grand mean */ 

/* remove column means */ 
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if d > 2 then 

call execute('%let p3=', char(percent[3], 8,1), 

*/ 

Extract first d columns of U & V, and first d elements of Q; 
U = U[, l:d] ; 

V = V[, 1 :d] ; 

Q = Q [ 1: d ] ; 

Scale the vectors by QL, QR; 

* Scale factor 'scale' allows expanding or contracting the variable 
vectors to plot in the same space as the observations; 

QL= diag(Q ## g ); 

QR= diag(Q ## (1-g)); 

A = U * QL; 

B = V * QR; 

ratio = max(sqrt(A[,##])) / max(sqrt(B[,##])); 

print 'OBS / VARS ratio:' ratio 'Scale:' scale; 
if scale=0 then scale=ratio; 

B = B # scale; 

OUT=A // B; 

Create observation labels; 
id = id // vars'; 

type = repeat({"OBS "},n,l) // repeat({"VAR "},p,l); 

id = concat(type, id); 

factype = {"GH" "Symmetric" "JK"}[1 + 2#g]; 
print "Biplot Factor Type", factype; 

cvar = concat(shape({"DIM"},1,d), char(1:d,1.)); 
print "Biplot coordinates", 

out[rowname=id colname=cvar f= 9.4]; 

%if &pplot = YES %then %do; 

call pgraf(out[,{1 2}],substr(id,5),'Dimension l', 'Dimension 

'Biplot'); 

%end; 

create &out from out[rowname=id colname=cvar]; 
append from out[rowname=id]; 
finish; 

start power(x, pow); 

if pow=l then return(x); 

if any(x <= 0) then x = x + ceil(min(x)+.5); 
if abs(pow)<.001 then xt = log(x); 

else xt = ((x##pow)-l) / pow; 

return (xt); 
finish; 

/*- Main routine */ 

use &data; 

read all var &var into y[ c=vars ]; 

%if &id = %str () %then %do; 

id=compress(char(1:nrow(xy),4))'; 

%end; 

%else %do; 

read all var{&id} into id; 

%end; 

* read all var &var into y[colname=vars rowname=&id]; 

%if &power / "= 1 %then %do; 

y = power(y, &power); 

%end; 


scale 


&scale; 




run biplot(y, id,vars,out, &p, scale 
quit ; 

| Split ID into _TYPE_ and _NAME_ | 


data &out; 
set &out; 
drop id; 

length _type_ $3 _name_ $16; 

_type_ = substr(id,1,3); 

_name_ = substr(id,5); 
label 

%do i=l %to &dim; 

dim&i = "Dimension &i (&&p&i%str(%%))" 
%end; 


| Annotate observation labels and variable vectors | 

* - */ 

%*-- Assign colors and symbols; 

%let c1= %scan(&colors,1); 

%let c2= %scan(Scolors,2); 

%if &c2=%str() %then %let c2=&cl; 

%let vl = %upcase(%scan(&symbols,1)); 

%let v2= %upcase(%scan(&symbols,2)); 

%if &v2=%str() %then %let v2=&vl; 

%let il= %upcase(%scan(&interp,1)); 

%let i2= %upcase(%scan(&interp,2)); 

%if &i2=%str() %then %let i2=&il; 
data &anno; 
set &out; 

length function color $8 text $16; 

xsys='2'; ysys='2'; %if &dim > 2 %then %str(zsys='2';); 
text = name ; 


if _type_ = 'OBS' then do; /* Label 

color="&cl"; 

if "&il" = 'VEC' then link vec 
x = &xanno; y = &yanno; 

%if &dim > 2 %then %str(z = &zanno;); 

%if &vl=NONE %then 
%str (position='5';); 

%else %do; 
if diml >=0 

then position=’>’; /* rt 

else position='<'; /* lt 

%end; 

function='LABEL '; output; 
end; 


/* Label observations (row points) 


/* rt justify 
/* lt justify 


if _type_ = 'VAR' then do; /* Label variables (col points) 

color="&c2"; 

if "&i2" = 'VEC' then link vec; 
x = &xanno; y = &yanno; 
if diml >=0 

then position='6'; /* down justify */ 

else position='2'; /* up justify */ 

function='LABEL '; output; /* variable name */ 

end; 

return; 

s: /* Draw line from the origin to point */ 








X = 0; y = 0; 

%if &dim > 2 %then %str(z = 0;); 
function='MOVE' ; output; 

x = &xanno; y = &yanno; 

%if &dim > 2 %then %str(z = &zanno;); 
function='DRAW' ; output; 

return; 

%if &gplot = YES %then %do; 

%if &il=VEC %then %let il=NONE; 

%if &i2=VEC %then %let i2=NONE; 

%let legend=nolegend; 

%let warn=0; 

%if %length(&haxis)=0 %then %do; 

%let warn=l; 

axis2 offset=(l,5) ; 

%let haxis=axis2; 

%end; 

%if %length(&vaxis)=0 %then %do; 

%let warn=l; 

axisl offset=(l / 5) label=(a=90 r=0); 

%let vaxis=axisl; 

%end; 

proc gplot data=&out &GOUT; 

plot dim2 * diml = _type_/ 

anno=&anno frame &legend 
href=0 vref=0 lvref=3 lhref=3 
vaxis=&vaxis haxis=&haxis 
vminor=l hminor=l 

name="&name" des="Biplot of &data"; 
symboll v=&vl c=&cl i=&il; 
symbol2 v=&v2 c=&c2 i=&i2; 
run; guit; 

%if &warn %then %do; 

%put WARNING: No VAXIS= or HAXIS= parameter was specified, 
so the biplot axes have not; 

%put WARNING: been equated. This may lead to incorrect 

interpretation of distance and; 

%put WARNING: angles. See the documentation.; 

%end; 

goptions reset=symbol; 

%end; /* %if &gplot=YES */ 

%done: 

%mend BIPLOT; 


Input data untuk %BIPLOT berupa matriks rataan yang berukuran n atribut 
x p peubah. 


data teh; 

input id$ ukuran desain harga merk warna variasi khasiat aroma praktis; 
cards; 


Sosro 

1.3115 

0.6803 

1.6557 

1.3279 

1.175 

1.2623 

1.4918 

1.5164 

1.1885 

Javati6 

-0.2131 

-0.2787 

-0.9098 

-0.2975 

0.0248 

0.0738 

-0.1721 

-0.2213 

-0.041 

K j enggot 

0.9508 

0.5328 

1.2377 

0.8607 

0.8595 

0.8197 

0.6967 

0.5574 

0.8607 

PekoSuper- 

-0.2397 

-0.4463 

-0.6803 

-0.1639 

0.0749 

-0.1066 

-0.1393 

-0.1885 

-0.1803 

PucukBola 

0.1803 

-0.3033 

-0.7541 

-0.0902 

0.0413 

-0.0328 

-0.0902 

-0.1074 

-0.123 

Javati 

0.0165 

-0.0492 

-0.7377 

-0.2869 

0.0246 

0.1639 

0.082 

-0.0328 

0.1967 
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Untuk definisi peubah pada input, peubah yang berisi atribut maka nama 
peubah harus id$. Sedangkan nama peubah untuk atribut lainnya bebas. 

Syntaks untuk menjalankan program makro %BIPLOT sebagai berikut: 


%biplot; 
run; 

Output %BIPLOT berupa nilai singular dan keragamannya, ratio skala garis 
pada biplot, koordinat biplot, serta biplot itu sendiri. 


Dua nilai singular pertama menunjukkan keragaman yang diterangkan 
oleh komponen 1 (sumbu utama 1) dan komponen 2 (sumbu utama 2) 
pada biplot. Besarnya keragaman yang dapat diterangkan oleh kedua 
sumbu utama tersebut dilihat dari persentase keragamannnya. 


Sedangkan interpretasi dari biplot adalah : 

1. Panjang vektor peubah sebanding dengan keragaman peubah 
tersebut. Semakin panjang vektor suatu peubah maka 
keragaman peubah tersebut semakin tinggi. 

2. Nilai cosinus sudut antara dua vektor peubah menggambarkan 
korelasi kedua peubah. Semakin sempit sudut yang dibuat 
antara dua peubah maka semakin positif tinggi korelasinya. Jika 
sudut yang dibuat tegak lurus maka korelasi keduanya rendah. 
Sedangkan jika sudutnya tumpul (berlawanan arah) maka 
korelasinya negatif. 

3. Posisi objek yang searah dengan suatu vektor peubah 
diinterpretasikan sebagai besarnya nilai peubah untuk objek yang 
searah dengannya. Semakin dekat letak objek dengan arah 
yang ditunjuk oleh suatu peubah maka semakin tinggi peubah 
tersebut untuk objek itu. Sedangkan jika arahnya berlawanan, 
maka nilainya rendah. 

4. Kedekatan letak/posisi dua buah objek diinterpretasikan sebagai 
kemiripan sifat dua objek. Semakin dekat letak dua buah objek 
maka sifat yang ditunjukkan oleh nilai-nilai peubahnya semakin 
mirip. 
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Output dari teladan diatas adalah : 


Singular values and variance accounted for 
Singular Values Percent Cum % 


4.5455 

97.14 

97.14 

0.5607 

1.48 

98.61 

0.4348 

0.89 

99.50 

0.3047 

0.44 

99.94 

0.1141 

0.06 

100.00 

0.0000 

0.00 

100.00 

0.0000 

0.00 

100.00 

0.0000 

0.00 

100.00 

0.0000 

0.00 

100.00 


OBS / VARS ratio: 1.231934 Scale: 1 


Biplot Factor Type 
Symmetric 

Biplot coordinates 



DIMl 

DIM2 

OBS Sosro 

1.5247 

0.3741 

OBS Javati6 

-0.6953 

0.0702 

OBS KJenggot 

0.8706 

-0.5639 

OBS PekoSupe 

-0.6600 

-0.1447 

OBS PucukBol 

-0.5587 

-0.0128 

OBS Javati 

-0.4812 

0.2771 

VAR ukuran 

0.6655 

-0.0419 

VAR desain 

0.4802 

-0.0190 

VAR harga 

1.2012 

-0.4256 

VAR merk 

0.7210 

-0.1142 

VAR warna 

0.5364 

-0.0854 

VAR variasi 

0.5713 

0.1364 

VAR khasiat 

0.6828 

0.3517 

VAR aroma 

0.6933 

0.4584 

VAR praktis 

0.5903 

0.0688 



□ rrensi on 1 (97. 1S^> 
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Keragaman yang diterangkan oleh sumbu utama 1 sebesar 97.14 dan 
sumbu utama 2 sebesar 1.48, sehingga secara keseluruhan 
keragaman yang dapat diterangkan oleh kedua sumbu tersebut 
sebesar 98.61%. Ratio skala yang digunakan dalam biplot adalah 1. 
Pada biplot terlihat ada empat pengelompokan merk yang cukup 
jelas. Sosro menempatkan diri sebagai merk dengan sifat-sifat yang 
lebih tinggi nilainya dari yang lain, seperti aroma, khasiat yang 
terkandung dan variasi rasanya. Cap kepala jenggot menyusul di 
belakangnya. Cap kepala jenggot dikenal sebagai merk teh dengan 
harga yang mahal. Keduanya dinilai mempunyai desain kemasan 
yang menarik. 

Kelompok berikutnya adalah merk pucuk bola dan peko super, yang 
digambarkan memiliki tingkat harga yang relatif murah dan warna 
seduhan yang tidak terlalu jelek, tapi dinilai memiliki desain kemasan 
yang paling buruk dari kelompok yang lain. 

Kelompok terakhir adalah teh javati dan javati 6138. Kelompok ini 
dinilai sebagi merk-merk yang paling tidak populer, tidak dikenali. 
Namun demikian memiliki variasi rasa, yang menurut penilaian 
responden, cukup. 

Jika dilihat perbandingan yang hanya melibatkan empat merk saja 
selain sosro dan cap kepala jenggot, javati dan cap pucuk bola 
mendapat penilaian yang lebih baik, terutama javati. Atribut 
menonjol dari merk pucuk bola adalah kepopuleran merk dan warna 
seduhan, meskipun untuk atribut warna masih lebih baik merk peko 
super. 

Sedangkan javati terlihat menonjol hampir pada semua atribut. 
Bertolak belakang dengan kedudukan javati 6138 yang dinilai negatif 
pada semua atribut. 
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11.5. Latihan 


1. Didapatkan hasil biplot seperti gambar dibawah ini 



a. Apakahyang dimaksud dengan analisis biplot? 

b. Sebutkan tahapan yang harus dilakukan dalam analisis biplot? 

c. Perhatikan hasil analisis biplot diatas, yaitu mengenai 20 kode 
contoh produk parfum dengan peubah Aroma intensity, aroma 
quality, Body, Acidity, Bitternes, dan Astrigency. Interpretasilah 
hasil biplot tersebut dan buatkan kesimpulanya! 
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12 


12.Analisis Korespondensi (Correspondency 
Analysis ) 


12.1. Pendahuluan 

Analisis korespondensi adalah suatu ilmu yang mempelajari hubungan 
antara dua atau lebih peubah kualitatif, yaitu dengan teknik 
multivariate secara grafik yang digunakan untuk eksplorasi data dari 
sebuah tabel kontingensi. Analisis korespondensi ini meproyeksikan baris- 
baris dan kolom-kolom dari matriks data sebagai titk-titik ke dalam 
sebuah grafik berdimensi rendah dalam sebuah jarak Euclid. Analisis 
korespondensi seringkali digunakan untuk menetapkan kategori- 
kategori yang mirip dalam satu peubah, sehingga kategori-kategori 
tersebut dapat digabungkan menjadi satu kategori. Analisis ini juga bisa 
digunakan untuk menentukan kemungkinan hubungan antara dua 
gugus peubah. 

Berdasarkan kegunaannya, analisis korespondensi dan analisis 
komponen utama memiliki kesamaan, yaitu suatu metode yang 
digunakan untuk mereduksi dimensi data menjadi dimensi yang lebih 
kecil dan sederhana. Sedangkan letak perbedaannya adalah bahwa 
analisis komponen utama lebih tepat untuk data dengan skala 
pengukuran kontinu sedangkan analisis korespondensi lebih tepat 
digunakan untuk data kategori. 
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Dalam Analisis Korespondensi ada beberapa asumsi yang harus 
dipenuhi: 


□ Ukuran jarak Ki Kuadrat antar titik-titik (nilai kategori) analogi 
dengan konsep korelasi antar variabel. 

□ Variabel kolom yang tepat di variabel kategori baris diasumsikan 
homogen. 

□ Analisis Korespondensi adalah sebuah teknik nonparametrik yang 
tidak memerlukan pengujian asumsi seperti kenormalan, 
autokorelasi, multikolinearitas, heteroskedastisitas, linieritas sebelum 
melakukan analisis selanjutnya. 

□ Dimensi yang terbentuk dalam Analisis Korespondensi disebabkan 
dari kontribusi titik-titik dari dimensi yang terbentuk dan penamaan 
dari dimensinya subjektif dari kebijakan, pendapat dan error. 

□ Dalam Analisis Korespondensi variabel yang digunakan yaitu 
variabel diskrit (nominal/ordinal) yang mempunyai banyak 
kategori. 

Beberapa kelebihan dan kekurangan analisis korespondensi yaitu : 

□ Kelebihan 

□ Sangat tepat untuk menganalisis data variabel kategori 
ganda yang dapat digambarkan secara sederhana 
dalam data tabulasi silang. 

□ Tidak hanya menggambarkan hubungan antar baris 
dengan kolom tetapi juga antar kategori dalam setiap 
baris dan kolom. 

□ Memberikan tampilan grafik gab ungan dari 
kategori baris dan kolom dalam satu gambar yang 
berdimensi sama. 

□ Cukup fleksibel untuk digunakan dalam data matrik 
berukuran besar. 
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□ Kekurangan 

□ Analisis ini tidak cocok untuk pengujian hipotesis 
tetapi sangat tepat untuk eksplorasi data. 

□ Tidak mempunyai suatu metode khusus untuk 
menentukan atau memutuskan jumlah dimensi yang 
tepat. 

Algoritma analisis korespondensi 
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12.2. Tabel Kontingensi Dua Arah 


Jika X dan Y adalah dua peubah yang masing-masing mempunyai 
sebanyak a dan b kategori, maka dapat dibentuk suatu matriks data 
pengamatan P yang berukuran ax b dengan p t j > 0 menyatakan 
frekuensi dari sel (i,;). 



'Pil 

Pl2 ' 

Plb 

p = 

P21 

P22 

■■ P2b 


.Pai 

Pa2 ' 

■* Pab. 


Matriks P diatas juga dapat disajikan dalam bentuk table kontingensi, 
sebagai berikut: 


Table 1. Table kontingensi dua arah 



Yi 

Yj 

Y b 

Total 


n±i 

n ij 

n± b 

fti. 

Xi 

n t 1 

n ij 

n ib 

n t . 

X a 

n a 1 

Kaj 

Tlab 

n a . 

Total 

n. 1 

nj 

n b 

n 
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Keterangan : 


b 



i =1 
a b 



peluang marginal X 

Peluang marginal Y 

Total jumlah frekuensi dari matriks P 

Frekuensi pengamatan ke-i baris pada 
kolom ke-j 


Dari tabel kontingensi dua arah di atas dapat dibentuk matriks 
korespondensi sebagai berikut: 

p axb = (Pij) = (—) 

n 


Bila setiap elemen pada suatu baris dijumlahkan maka diperoleh 
vektor dari jumlah baris matriks P yaitu r’ =P I = (pi.,...,p a .)\ Sehingga 
didapat Dr = diag (r) adalah diagonal matriks baris yaitu: 


D r = diagir) = 


Pi. 0 ••• 0 

0 p 2 • • • 0 

0 o - Pa . 


Dengan cara yang sama, akan didapat jumlah setiap kolom dari 
matriksnya menjadi vektor jumlah kolom dari matriks P yaitu c = P’ I = 
(P.i'-’P.b)’ sehingga didapat D c = diag(c) adalah diagonal matriks 
kolom sebagai berikut: 


D c = diag( c) = 


Pa 

0 


0 ••• 0 

Pi ••• 0 


0 0 ••• p„ 
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12.3. Profil Baris dan Profil Kolom 


Profil adalah proporsi dari setiap baris atau kolom Matriks 
Korespondensi yaitu setiap frekuensi pengamatan baris ke-i dan kolom 
ke-j dibagi dengan jumlah setiap total baris dan kolomnya masing- 
masing. 

Matriks diagonal kolom dan baris diatas masing-masing berukuran 
bxb dan a x a. Kemudian dapat dibentuk matriks R yang berukuran 
axb sebagai berikut: 

Pn Pn ... Pw 

P\. Pi. Ph 

P 21 P 22 ### P2b 

P 2. P 2. m P 2. 

Pai Pa2 Pab 

Pa. Pa. Pa. 

Matriks R disebut profil baris (row profile) dalam ruang berdimensi b , 
dengan jumlah unsur-unsur profil dari baris adalah sama dengan 
satu. Selanjutnya didefinisikan profil baris ke-i sebagai r t yaitu: 

t 

Pn Pi2 ... Pit 

Pi. ’ Pi. ’ ’ Pi. ; 

r i = 

Sedangkan matriks C berukuran bxa adalah: 

P11 Pl2 ... Pal_ 

P. 1 P. 1 P.l 

P 21 P 22 . . . Pa7. 

P.7. P.7. P.7. 

Plb Plb ... Pub_ 

P.b P.b P.b 
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Matriks C disebut sebagai profil kolom (column profile) dalam ruang 
berdimensi a, dimana jumlah unsur-unsur dari profil kolom sama 
dengan satu. Sehingga profil kolom ke-j sebagai c- yaitu : 


r 

P }1 Pv_ _ Paj^ 
Pj'P.j' P J j 


Untuk menampilkan profil-profil baris dan profil-profil kolom tersebut 
kedalam ruang dimensi Euclid yang berdimensi dua digunakan 
pendekatan jarak Ki Kuadrat, yaitu: 


i =1 7=1 


n u - - 
b y 


_ n V V Pi.P .j > 
i'=l 7=1 Pi.Pj 


m 

= ntr(E) = rlfi 

i =1 


Misal diberikan suatu matriks korespondensi dengan D r adalah matriks 
diagonal baris, D c adalah matriks diagonal kolom, r merupakan vektor 
jumlah baris dan c adalah vektor jumlah kolom. Maka dapat 
dibentuk suatu matriks E sedemikian sehingga : 


E = D r 1 (P-rc’)Dc 1 (P-rc)’ 

Al > ... > adalah nilai inersia atau akar ciri tak nol dari E 

dan m = rank . (E) = rank (P - rc') = ( min(a,b ) - 1) maka X 2 dapat 
juga dituliskan sebagai berikut: 

a 

X 2 = n^pi.df 

i=1 
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dengan d ? = -c^J) c 1 ^ -c 

12.4. Penguraian Nilai Singular 

Untuk mereduksi dimensi data berdasarkan keragaman data (nilai 
eigen/inersia) terbesar dengan mempertahankan informasi optimum, 
diperlukan penguraian nilai singular. Penguraian nilai singular ( singular 
value decomposifion ) merupakan salah satu konsep aljabar matriks dan 
konsep eigen decomposifion yang terdiri dari nilai eigen A dan vector 
eigen. 

Teorema dekomposisi nilai singular: 

Misalkan A matriks berukuran m x n, maka ada matriks diagonal I 
berukuran rxr dimana r < min {m, n}, matriks orthogonal U berukuran 
171X171, matriks orthogonal V berukuran m x n , sehingga A = UIV\ 

Berdasarkan teorema dekomposisi nilai singular di atas, maka matriks 
yang akan di singular value decomposifion matriks U = D r 1/2 (P- 
rc')D c 1/2 yang akan menghasilkan matriks A berukuran axm dan matriks 
B berukuran b xm, dan A merupakan suatu matriks yang elemen- 
elemennya adalah nilai singular, dimana nilai singular adalah akar dari 
nilai inersia. 


12.4.1. Penguraian Nilai Singular Umum 

Untuk menentukan anak ruang Euclid dan memproyeksikan semua profil 
baris ke dalam anak ruang Euclid digunakan penguraian nilai singular 
umum atau Generalized Singular Value Decomposifion (GSVD) 

Koordinat dari baris dan kolomnya ditentukan dengan menffunakan 
GSVD dari matriks (P-rc 1 )/ yaitu AAB ’, A merupakan matriks diagonal 
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yang mempunyai unsur-unsur diagonalnya nilai singular dari matriks 
(P - rc 1 ), dimana merlaku A'D r _1 A = / m dan B'D^B = / m . 

Tiap himpunan titik dapat dihubungkan dengan sumbu utama dari 
himpunan titik lainnya, yaitu : 


Analisis Profil Baris 

Analisis Profil Kolom 

Analisisn Baris dan 
Kolom 


Rumusan koordinat 
baris 

F = D r -1 i4A 
F = D~ X A 
F = D-'AA 


Rumusan Koordinat 
kolom 

G = D~ X B 

G = D~ X BA 

G = D~ X BA 


12.5. Nilai Inersia 

Untuk mempresentasikan profil-profil baris dan profil-profil kolom ke 
dalam ruang dimensi d < m. koordinat dari i baris dari matriks yang 
dibentuk dengan mengambil d kolom pertama dari F = D r ~ r AA, dan 
koordinat j profil kolom adalah j baris dari matriks yang dibentuk 
dengan mengambil k kolom pertama dari G = D C -1 PA. Karena total 
inersia mempresentasikan semua informasi dalam seluruh ruang adalah 
tr(E ) =nYi l ^i ' nnaka pendekatan ruang berdimensi m dengan ruang 
berdimensi k dikatakan baik jika A* mendekati total inersia atau Ef 1 /^ 
mendekati nol. 

Nilai inersia menunjukan kontribusi dari baris ke-i pada inersia total. 
Inersia total adalah jumlah bobot kuadrat jarak titik-titik ke pusat, massa 
dan jarak yang didefenisikan. 
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Inersia total baris: in (a) = Sn.Cn. - (n. - c) 

Inersia total kolom: in (b) = £ c 7 (c 7 - r)'D r _1 (c 7 - r) 

Jumlah bobot kuadrat koordinat titik-titik dalam sumbu utama ke-d 
pada tiap-tiap himpunan yaitu X d yang dinotasikan dengan X d . Nilai ini 
disebut sebagai inersia utama ke-d. Persamaan inersia utama baris dan 
kolom serta pusatnya dapat dinyatakan sebagai berikut: 

Inersia utama baris adalah FD r F = A 

Bukti : F D r F = (D r _1 AA) D r (D r _1 A) = KA{D r ~ 1 )~ l IA = A 'A'D^A 

dengan menggunakan persamaan A'D r ~ x A = l m , didapatkan 
AI m = A'. Karena matriks A' simetrik sehingga A' = A, jadi 

F D r F = A 

Inersia utama baris adalah G D C G = A 
Bukti: GD C G = (D C _1 BA) D c (D c _ 1 B) = AB'(D c _1 ) _1 /B = 

dengan menggunakan persamaan B'D^B = / m , didapatkan 
AI m = A'. Karena matriks A' simetrik sehingga A' = A, jadi 

G D C G = A 

Besaran dapat diinterpretasikan sebagai besarnya kontribusi 

yang diberikan pada total inersia oleh masing-masing dimensi pertama, 
kedua, dan seterusnya, sehingga besaran relative untuk mengukur 
besarnya kehilangan informasi dapat dirumuskan sebagai berikut: 



12.6. Koefisien Kontingensi 

Untuk melihat keeratan hubungan atau kecendrungan antara variable 
satu dengan yang lainnya, digunakan rumusan kooefisien kontingensi 
sebagai berikut: 
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dimana x 2 = statistik uji Khi Kuadrat, dan N =banyaknya populasi 
sample,0 < C < 1 

12.7. Ilustrasi 

Pada suatu studi kasus, kepada 1500 responden (mahasiswa suatu 
perguruan tinggi) diminta untuk mengisi kusioner dengan peubah- 
peubah sebagai berikut: 

1. Code : nomor urut responden 

2. Sex : jenis kelamin responden 

3. Age : umur peserta responden 

4. Family income : pendapatan orang tua, dalam hal ini 
pendapatan dibagi menjadi 4 

kategori, yaitu 0-25000 ; 25001-50000 ; 50001-75000 ; 75000-inf 

5. GPA : nilai indeks prestasi kumulatif yang diperoleh, 

dengan skala 1 sampai 4 

6. /Q : nilai intelegensi 

7. C/ass standing : dibagi dalam 4 kategori, yaitu mahasiswa baru 

( freshman ), mahasiswa tingkat 2 ( sophomore ), mahasiswa 

tingkat 3 ( junior ), mahasiswa tingkat akhir ( senior ) 

8. Drink week : banyaknya Alkohol yang dikonsumsi setiap 
minggunya (dalam satuan botol) 

9. Hardworker : banyaknya kelas yang dihadiri, dengan 
rentangan 1-20 

10. Final grade : nilai akhir yang diperoleh dari mata kuliah 
Psikologi 

Dalam hal ini ingin dilihat apakah terdapat hubungan antara family 
income dengan c/ass standing. 
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Hasil Analisis 


Tabulasi silang antara peubah family income dan class standing disuatu 
perguruang tinggi dapat dilihat pada tabel output SPSS di bawah ini: 


Correspondence Table 


Family Income 

Class Standing 

Freshman 

Sophomore 

Junior 

Senior 

Active Margin 

00000 - 25000 

23 

122 

39 

23 

207 

25001 - 50000 

89 

288 

97 

90 

564 

50001 - 75000 

67 

282 

114 

62 

525 

75001 -inf 

34 

104 

36 

30 

204 

Active Margin 

213 

796 

286 

205 

1500 


Dari tabel tabulasi silang di atas, dapat dilihat bahwa : 

1. Responden terbanyak berasal dari c/ass standing dengan 
kategori sophomore (mahasiswa tingkat 2) 

2. Pada umumnya responden berasal dari keluarga 
dengan family income 25001 -50000. 


Row Profiles 


Family Income 

Class Standing 

Freshman 

Sophomore 

Junior 

Senior 

Active Margin 

00000 - 25000 

.111 

.589 

.188 

.111 

1.000 

25001 - 50000 

.158 

.511 

.172 

.160 

1.000 

50001 - 75000 

.128 

.537 

.217 

.118 

1.000 

75001 - inf 

.167 

.510 

.176 

.147 

1.000 

Mass 

.142 

.531 

.191 

.137 



Dari profil baris di atas dapat dilihat bahwa : 

1. Nilai massa terbesar (0,531) terdapat pada class standing 
kategori sophomore yang merupakan modus pada data ini 
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2. Jika diperhatikan profil setiap kolom, maka dapat dilihat nilai 
terbesar untuk kolom: 

a. Freshman adalah pada baris family income dengan kategori 
ke 4 (75001 -inf), hal ini menunjukkan bahwa secara umum 
mahasiswa dengan family income 75001 -inf berasal dari 
mahasiswa baru (freshman). 

b. Sophomore adalah pada baris family income dengan 
kategori 1 (0-25000), yang menunjukkan bahwa umumnya 
mahasiswa tingkat 2 (sophomore) kebanyakan berasal dari 
keluarga dengan income paling rendah. 

c. Junior adalah pada baris familiy income dengan kategori 3 
(50001-75000), yang menunjukkan bahwa mahasiswa tingkat 
3 (junior) berasal dari keluarga dengan family income 50001- 
75000. 

d. Senior adalah pada baris familiy income dengan kategori 2 
(25001-50000), yang menunjukkan bahwa mahasiswa tingkat 
akhir (senior) umumnya berasal dari keluarga dengan familiy 
income menengah yaitu 25001-50000. 


Column Profiles 


Family Income 

Class Standing 

Freshman 

Sophomore 

Junior 

Senior 

Mass 

00000 - 25000 

.108 

.153 

.136 

.112 

.138 

25001 - 50000 

.418 

.362 

.339 

.439 

.376 

50001 - 75000 

.315 

.354 

.399 

.302 

.350 

75001 - inf 

.160 

.131 

.126 

.146 

.136 

Active Margin 

1.000 

1.000 

1.000 

1.000 



Dari profil kolom di atas dapat dilihat bahwa : 

1. Nilai massa terbesar (0,376) terdapat pada family income 
dengan kategori income 25001-50000 yang merupakan modus 
pada data ini 
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2. Jika diperhatikan profil setiap baris, maka dapat dilihat nilai 
terbesar untuk baris: 

a. Family income kategori 1 adalah pada kolom class standing 
kategori sophomore, hal ini menunjukkan bahwa secara 
umum mahasiswa dengan family income terendah (0-25000) 
berasal dari mahasiswa tingkat 2 (sophomore) 

b. Family income kategori 2 adalah pada kolom class standing 
kategori senior, yang menunjukkan bahwa umumnya 
mahasiswa tingkat akhir (senior) kebanyakan berasal dari 
keluarga dengan income bekisar antara 25001 sampai 
50000. 

c. Family income dengan kategori 3 adalah pada kolom class 
standing kategori Junior, yang menunjukkan bahwa keluarga 
dengan income berkisar antara 50001-75000 berasal 
mahasiswa tingkat 3 (junior). 

d. Family income dengan kategori 4 adalah pada kolom class 
standing kategori freshman, yang menunjukkan bahwa pada 
umumnya mahasiswa yang baru masuk berasal dari keluarga 
dengan income paling tinggi yaitu berkisar antara 75001 -inf. 


Jika kita perhatikan dari kedua profil di atas, baik profil baris maupun 
profil kolom, terlihat bahwa keduanya menyatakan satu hal yang sama 
meski dengan tampilan nilai-nilai yang berbeda. 


Summary 


Dimension 

Singular 

Value 

Inertia 

Chi 

Square 

Sig. 

Proportion of Inertia 

Confidence Singular 
Value 

Accounted 

for 

Cumulative 

Standard 

Deviation 

Correlation 

2 

1 

.089 

.008 



.866 

.866 

.026 

.011 

2 

.033 

.001 



.119 

.985 

.026 


3 

.012 

.000 



.015 

1.000 



Total 


.009 

13.825 

.129° 

1.000 

1.000 
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Pada tabel di atas terlihat bahwa eigenvalue (inertio) menunjukkan 
bahwa nilai varians yang dapat dijelaskan adalah sebesar 0.009 atau 
0.9% saja. Jika melihat nilai Chi-Square, dimana nilai p_value sebesar 
0,129 (> 0,01) hal ini memperlihatkan bahwa tidak terdapat hubungan 
antara family income dengan class standing.. 

Korelasi kanonik maksimum (yang merupakan interpretasi dari Singulor 
Volue yang merupakan akar kuadrat dari Eigenvalue ) antar kategori 
dari variabel-variabel dalam analisis untuk setiap dimensi adalah 0.089 
untuk dimensi pertama (terbesar), 0.033 untuk dimensi kedua (juga 
merupakan yang kedua terbesar), dan 0.012 untuk dimensi ketiga, 
sedangkan dari eigenvector yang diperoleh dalam analisis ( proportion 
of inertia ), maka dengan 3 faktor dapat dinyatakan bahwa keragaman 
yang dapat diterangkan adalah sebesar 100% dengan rincian sebagai 
berikut: 

1. Faktor pertama dengan eigenvalue sebesar 0.008 mampu 
menerangkan keragaman data sebesar 86.6%. 

2. Faktor kedua dengan eigenvalue sebesar 0.001 mampu 
menerangkan keragaman data sebesar 11.9% (total dengan 
faktor pertama adalah 98.5 %) 

3. Faktor ketiga dengan eigenvalue sebesar 0.000 mampu 
menerangkan keragaman data sebesar 1.5% (total dengan 
sebelumnya menjadi 100%). 

Maka dari rincian di atas, cukup menggunakan 2 dimensi saja karena 2 
dimensi ini sudah sangat baik dalam menerangkan keragaman data, 
yakni sebesar 98.5%. 

Confidence Row Points dan Confidence Column Points di bawah ini 
memperlihatkan Standard deviasi dari skor-skor baris dan kolom (nilai- 
nilai ini digunakan sebagai koordinat untuk memplot Correspondence 
Map dan juga digunakan untuk menilai presisinya). 
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Confidence Row Points 


Family Income 

Standard Deviation in Dimension 

Correlation 

1 

2 

1-2 

00000 - 25000 

B 

B 

.442 

25001 - 50000 

.087 

.146 

-.165 

50001 - 75000 

.112 

.097 

-.513 

75001 -inf 

B 

B 

-.014 


Confidence Column Points 


Class Standing 

Standard Deviation in Dimension 

Correlation 

1 

2 

1-2 

Freshman 

BUI 

BI 

.171 

Sophomore 

.088 

.072 

.419 

Junior 

.195 

.163 

-.354 

Senior 

B 

■ 

.006 


Pada dua tabel di atas dapat dilihat bahwa Standard deviasi yang 
besar menunjukkan presisi rendah rendah bagi suatu poin atau kategori 
untuk ditempatkan pada dimensi atau faktor tertentu. Sebaliknya 
semakin rendah nilai Standard deviasinya, maka semakin baik presisinya. 


Jika kita lihat presisi tersebut pada ke dua tabel di atas, maka family 
income untuk kategori 1 dan 4 berada pada dimensi yang relatif sama 
(berdekatan), begitu pula dengan class standing untuk kategori 
freshman dan senior. 


Symmetrical Normalization 
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Dari figur di atas dapat dilihat bahwa pada umumnya mahasiswa 
tingkat 2 berasal dari keluarga dengan income antara 0-25000, 
mahasiswa tingkat 3 berasal dari keluarga dengan income berkisar 
antara 50001-75000, mahasiswa tingkat akhir berasal dari keluarga 
dengan pendapatan 25001-50000, sedangkan mahasiswa baru 
kebanyakan berasal dari keluarga dengan pendapatan tertinggi yakni 
lebih dari 75000. Hal ini juga sesuai dengan profil baris dan profil kolom 
yang telah dipaparkan di bagian awal analisis korespondensi. 


12.8. Aplikasi SAS 

Dengan menggunakan analisis korespondensi, bisa didapatkan plot 
dua dimensi yang bisa menjelaskan asosiasi antar kategori setiap 
peubah dengan cepat, dibandingkan dengan melihat kembali angka- 
angka yang ada di tabel kontingensi. Untuk melakukan analisis 
korespondensi pada SAS menggunakan PROC CORRESP. Penggunaan 
prosedur tersebut bisa melibatkan dua struktur data yang berbeda. 
Struktur data pertama adalah kolom-kolom masih berupa varibel 
kategorik. Artinya data yang dimiliki masih berupa data mentah. 
Struktur data yang lain, adalah jika kita sudah memiliki rangkuman 
berupa tabel kontingensi. 

Misalkan saja kita memiliki data 140 transaksi jual beli valuta asing yang 
dilakukan oleh perusahaan domestik dengan bank domestik. Ada 
sebanyak 4 perusahaan yang biasa melakukan penjualan valuta asing 
hasil ekspor produk mereka ke negara-negara tetangga, yaitu 
perusahaan A, B, C, dan D. Serta ada 4 bank utama yang menjadi 
tempat perusahaan-perusahaan tersebut menjual, yaitu W, X, Y, dan Z. 
dalam hal ini kita memiliki dua peubah kategorik, yaitu nama 
perusahaan penjual valuta asing dan nama bank tempat menjual 
valuta asing 
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Data yang diperoleh dari 140 transaksi terakhir adalah sebagai berikut 
(nomor yang ada merupakan nomor urut transaksi) 


1 

B 

W 

21 

C 

W 

41 

C 

W 

61 

D 

X 

81 

C 

W 

101 

A 

W 

121 

D 

W 

2 

C 

Y 

22 

B 

X 

42 

B 

X 

62 

D 

X 

82 

A 

z 

102 

C 

X 

122 

D 

Y 

3 

B 

X 

23 

B 

z 

43 

C 

W 

63 

A 

Z 

83 

A 

Y 

103 

B 

W 

123 

C 

W 

4 

C 

W 

24 

B 

X 

44 

B 

w 

64 

C 

Y 

84 

A 

X 

104 

B 

z 

124 

B 

Y 

5 

B 

X 

25 

D 

X 

45 

C 

z 

65 

D 

Y 

85 

D 

W 

105 

A 

z 

125 

A 

Y 

6 

D 

z 

26 

B 

w 

46 

B 

w 

66 

B 

Y 

86 

A 

X 

106 

B 

z 

126 

B 

W 

7 

A 

z 

27 

B 

X 

47 

A 

Y 

67 

B 

X 

87 

B 

w 

107 

D 

z 

127 

C 

Y 

8 

A 

Y 

28 

A 

X 

48 

D 

X 

68 

B 

Y 

88 

A 

X 

108 

A 

Y 

128 

C 

W 

9 

D 

Y 

29 

B 

X 

49 

A 

X 

69 

A 

Y 

89 

C 

X 

109 

C 

X 

129 

C 

Z 

10 

B 

Y 

30 

A 

Y 

50 

B 

Z 

70 

C 

W 

90 

C 

X 

110 

D 

X 

130 

D 

z 

11 

D 

X 

31 

A 

X 

51 

B 

z 

71 

B 

W 

91 

C 

z 

111 

C 

W 

131 

B 

X 

12 

A 

X 

32 

C 

Y 

52 

D 

X 

72 

C 

Y 

92 

C 

X 

112 

C 

X 

132 

B 

w 

13 

C 

Y 

33 

D 

Y 

53 

B 

Y 

73 

D 

Z 

93 

D 

X 

113 

D 

z 

133 

A 

w 

14 

A 

Y 

34 

C 

X 

54 

A 

W 

74 

B 

W 

94 

B 

X 

114 

B 

w 

134 

B 

w 

15 

A 

X 

35 

C 

Y 

55 

C 

X 

75 

D 

Y 

95 

B 

X 

115 

D 

X 

135 

A 

X 

16 

C 

W 

36 

C 

W 

56 

C 

X 

76 

C 

W 

96 

D 

X 

116 

C 

Y 

136 

B 

X 

17 

B 

W 

37 

B 

Y 

57 

C 

X 

77 

D 

Y 

97 

C 

z 

117 

C 

W 

137 

B 

w 

18 

B 

Y 

38 

C 

Y 

58 

C 

w 

78 

B 

Y 

98 

D 

w 

118 

A 

Y 

138 

D 

Y 

19 

D 

X 

39 

c 

X 

59 

D 

Y 

79 

A 

X 

99 

C 

z 

119 

D 

X 

139 

B 

W 

20 

B 

W 

40 

B 

W 

60 

B 

W 

80 

A 

Z 

100 

C 

w 

120 

A 

X 

140 

C 

X 


Perintah menyiapkan dan melakukan analisis korespondensi yang 
diberikan adalah sebagai berikut: 
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data 

contoh; 









input 

cards 

no Penjual$ 

Pembeli$ 

@@; 







1 

B 

W 

21 

c 

W 

41 

c 

w 

61 

D 


X 

81 

C 

w 

101 

A 

w 

121 

D 

W 

2 

C 

Y 

22 

B 

X 

42 

B 

X 

62 

D 


X 

82 

A 

Z 

102 

c 

X 

122 

D 

Y 

3 

B 

X 

23 

B 

Z 

43 

c 

W 

6 

A 


Z 

83 

A 

Y 

103 

B 

w 

123 

C 

W 

4 

c 

W 

24 

B 

X 

44 

B 

W 

64 

C 


Y 

84 

A 

X 

104 

B 

Z 

124 

B 

Y 

5 

B 

X 

25 

D 

X 

45 

c 

Z 

65 

D 


Y 

85 

D 

W 

105 

A 

z 

125 

A 

Y 

6 

D 

Z 

26 

B 

W 

46 

B 

W 

66 

B 


Y 

86 

A 

X 

106 

B 

Z 

126 

B 

W 

7 

A 

Z 

27 

B 

X 

47 

A 

Y 

67 

B 


X 

87 

B 

W 

107 

D 

Z 

127 

C 

Y 

8 

A 

Y 

28 

A 

X 

48 

D 

X 

68 

B 


Y 

88 

A 

X 

108 

A 

Y 

128 

C 

W 

9 

D 

Y 

29 

B 

X 

49 

A 

X 

69 

A 


Y 

89 

C 

X 

109 

C 

X 

129 

C 

Z 

10 

B 

Y 

30 

A 

Y 

50 

B 

Z 

70 

C 


W 

90 

C 

X 

110 

D 

X 

130 

D 

Z 

11 

D 

X 

31 

A 

X 

51 

B 

Z 

71 

B 


W 

91 

C 

Z 

111 

C 

W 

131 

B 

X 

12 

A 

X 

32 

C 

Y 

52 

D 

X 

72 

C 


Y 

92 

C 

X 

112 

C 

X 

132 

B 

w 

13 

C 

Y 

33 

D 

Y 

53 

B 

Y 

73 

D 


Z 

93 

D 

X 

113 

D 

Z 

133 

A 

W 

14 

A 

Y 

34 

C 

X 

54 

A 

W 

74 

B 


W 

94 

B 

X 

114 

B 

W 

134 

B 

W 

15 

A 

X 

35 

c 

Y 

55 

C 

X 

75 

D 


Y 

95 

B 

X 

115 

D 

X 

135 

A 

X 

16 

C 

W 

36 

c 

W 

56 

c 

X 

76 

C 


W 

96 

D 

X 

116 

C 

Y 

136 

B 

X 

17 

B 

W 

37 

B 

Y 

57 

C 

X 

77 

D 


Y 

97 

C 

Z 

117 

C 

W 

137 

B 

W 

18 

B 

Y 

38 

c 

Y 

58 

c 

W 

78 

B 


Y 

98 

D 

w 

118 

A 

Y 

138 

D 

Y 

19 

D 

X 

39 

c 

X 

59 

D 

Y 

79 

A 


X 

99 

C 

z 

119 

D 

X 

139 

B 

W 

20 

B 

W 

40 

B 

W 

60 

B 

W 

80 

A 


Z 

100 

C 

W 

120 

A 

X 

140 

C 

X 

proc 

corresp outc=hasil 

, 







tables penjual. 

pembeli 








%plotit (data=hasil, datatype : 

=corresp. 

color= 

'BLUE' ); 




run; 











Dengan perintah di atas diperoleh output sebagai berikut. 


The CORRESP Procedure 
Inertia and Chi-Square Decomposition 


Singular 

Value 

Principal 

Inertia 

Chi- 

Square 

Percent 

Cumulative 

Percent 

20 40 60 80 100 

0.31572 

0.09968 

13.9548 

98.90 

98.90 

-+-+-+-+- 

0.03277 

0.00107 

0.1503 

1.07 

99.97 


0.00552 

0.00003 

0.0043 

0.03 

100.00 


Total 

0.10078 

14.1095 

100.00 




Degrees of Freedom = 9 


Hasil di atas menggambarkan berapa persen kemampuan plot 
korespondensi memberikan informasi dari data awal. Dari data contoh. 


289 






diperoleh bahwa dengan menggunakan 2 dimensi pertama, mampu 
menerangkan data asal sebesar 99.97%. Ini berarti bahwa dalam kasus 
ini, informasi yang diberikan hampir sempurna. 


Berikutnya adalah koordinat dari setiap kategori peubah 



Row Coordinates 



Diml 

Dim2 

A 

0.3841 

0.0449 

B 

-0.3129 

-0.0148 

C 

-0.1943 

0.0189 

D 

0.3810 

-0.0499 


Column Coordinates 



Diml 

Dim2 

W 

-0.5078 

0.0017 

X 

0.1826 

-0.0357 

Y 

0.2099 

0.0513 

Z 

0.2042 

-0.0064 


Koordinat di ataslah yang nantinya akan dijadikan sebagai titik-titik 
pada plot dua dimensi hasil analisis korespondensi. Plot yang diperoleh 
dengan koordinat di atas adalah: 


The SAS System 



Berdasarkan data di atas terlihat bahwa perusahaan A dan D lebih 
sering menjual valuta asingnya ke bank X, Y atau Z, daripada 
menjualnya ke bank W. 
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Output lain berisi inersia dari setiap titik terhadap pembentukan kedua 
dimensi. 


Summary 

Statistics 

for the Row 

Points 


Quality 

Mass 

Inertia 

A 

0.9999 

0.2000 

0.2968 

B 

0.9997 

0.3071 

0.2992 

C 

0.9986 

0.2929 

0.1109 

D 

1.0000 

0.2000 

0.2930 


Partial Contributions to Inertia for the Row Points 



Diml 

Dim2 

A 

0.2960 

0.3762 

B 

0.3018 

0.0628 

C 

0.1109 

0.0976 

D 

0.2913 

0.4634 


Summary Statistics for the Column Points 



Quality 

Mass 

Inertia 

W 

1.0000 

0.2786 

0.7127 

X 

0.9996 

0.3357 

0.1154 

Y 

0.9999 

0.2429 

0.1125 

Z 

0.9960 

0.1429 

0.0594 


Partial Contributions to Inertia for the Column Points 



Diml 

Dim2 

W 

0.7206 

0.0007 

X 

0.1124 

0.3993 

Y 

0.1073 

0.5945 

Z 

0.0598 

0.0055 


Selain menggunakan data mentah, data dalam bentuk tabel 
kontingensi juga dapat dianalisis. Untuk mendapatkan tabel kontingensi 
dari data mentah di atas, bisa dilakukan menggunakan prosedur PROC 
FREQ pada SAS/BASE. 


Perintah yang diberikan adalah sebagai berikut 

proc freq data=contoh; 

tables penjual*pembeli/norow nocol nopercent; 

run; 


Hasilnya adalah sebagai berikut 
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The FREQ Procedure 


Table of Penjual by Pembeli 
Penjual Pembeli 

Frequency|W |X |Y |Z 

A | 3| 11 | 9| 

B | 18 | 12 | 8| 

C | 15 | 12 | 9| 

D | 3| 12 | 8| 

Total 39 47 34 


| Total 

5 | 28 

- + 

5 | 43 

- + 

5 | 41 

- + 

5 | 28 

- + 

20 140 


Selanjutnya, seandainya data yang mentah tidak kita miliki, namun kita 
memiliki data yang sudah berupa tabel kontingensi di atas, maka 


perintah yang diberikan adalah 


data 

contoh2; 

input 

. penjual$ pembeli$ frekuensi; 

cards ; 


A 

W 

3 

A 

X 

11 

A 

Y 

9 

A 

Z 

5 

B 

W 

18 

B 

X 

12 

B 

Y 

8 

B 

Z 

5 

C 

W 

15 

C 

X 

12 

C 

Y 

9 

C 

Z 

5 

D 

W 

3 

D 

X 

12 

D 

Y 

8 

D 

Z 

5 

proc 

corresp data=contoh2 outc=hasi!2; 

tables 

penjual, pembeli; 

weight 

frekuensi; 

run; 



%plotit (data=hasi!2 , datatype=corresp); 

run; 




Hasil yang diperoleh sama persis dengan hasil pada kasus 
menggunakan data mentah. 
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13 


13.Korelasi Kanonik (Canon/ca/ Correlation ) 


13.1. Pendahuluan 

Dalam banyak penelitian seringkali ditemukan respon terdiri dari banyak 
(lebih dari satu) peubah, sehingga mengharuskan peneliti untuk 
menggunakan metode analisis yang sesuai. Dalam kasus penelitian 
yang melibatkan banyak/multi respon, analisis statistika yang sesuai 
atau cocok digunakan adalah analisis peubah ganda ( multivariate ). 

Analisis peubah ganda ( multivariate ) merupakan salah satu teknik 
statistika yang digunakan untuk menganalisis data peubah ganda. 
Data peubah ganda yang dimaksud adalah data yang terdiri dari lebih 
dari satu peubah/peubah bebas ( independent ) dan lebih dari satu 
peubah/peubah tak bebas ( dependent ). Jenis data yang digunakan 
dalam analisis peubah ganda dapat terdiri dari data non metrik (skala 
nominal dan ordinal) dan data metrik (skala interval dan rasio). 

Salah satu teknik analisis peubah ganda yang sering digunakan ketika 
seorang peneliti ingin menguji hubungan (korelasi) antara beberapa 
peubah independen dengan beberapa peubah dependen adalan 
analisis korelasi kanonik. Beberapa peubah independen disebut gugus 
peubah independen sedangkan beberapa peubah dependen yang 
disebut gugus peubah dependen. Konsep korelasi dalam analisis 
peubah ganda merupakan perluasan dari konsep korelasi pada 
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univoriote yang responnya merupakan peubah tunggal. Hal yang 
membedakan diantara keduanya adalah jumlah dari peubah respon. 
Dalam univariate, peubah respon hanya terdiri dari satu peubah 
sedangkan dalam multivariate memiliki lebih dari satu peubah respon. 

Jenis korelasi yang dikenal dalam kasus univoriote adalah korelasi 
sederhana, korelasi parsial dan korelasi berganda. Dalam kasus 
multivoriote, analisis korelasi lebih dikenal dengan istilah analisis korelasi 
kanonik. Analisis korelasi kanonik tidak sesederhana korelasi sederhana, 
parsial atau berganda. Hal ini karena dalam analisis korelasi kanonik 
yang dicari adalah korelasi antargugus peubah independen dan gugus 
peubah dependen bukan korelasi antar peubah independen dan 
dependen. Berikut ini adalah contoh penelitian yang menggunakan 
korelasi kanonik dalam analisisnya. 

1. Seorang dokter ingin mengetahui adakah hubungan antara gaya 
hidup dan kebiasaan makan dengan kesehatan pasienyang 
diukur dengan peubah hipertensi, berat badan, tingkat 
ketegangan dan onxiety. 

2. Manajer pemasaran suatu perusahaan ingin mengetahui apakah 
ada hubungan antara jenis produk yang dibeli dan gaya hidup 
konsumen dan kepribadian konsumen. 

3. Seorang direktur bank ingin mengetahui hubungan antara 
penggunaan kartu kredit (diukur dengan jumlah kartu kredit yang 
dimiliki dan rata-rata uang yang dibelanjakan lewat kartu kredit 
perbulan) dengan karakteristik konsumen (diukur dengan 
besarnyajumlah keluarga dan ncome keluarga). 

Dalam menggunakan analisis korelasi kanonik, terdapat beberapa 
tahapan analisis yang umum dilakukan, seperti: 

1. Melakukan uji data dan uji asumsi analisis korelasi kanonik 

2. Menentukan fungsi kanonik dan ukuran kesesuaiannya 


294 



3. Menginterpretasikan hasil analisis korelasi kanonik 

4. Melakukan validasi hasil analisis korelasi kanonik. 

13.2. Analisis Korelasi Kanonik 

Analisis korelasi kanonik adalah salah satu teknik analisis statistika yang 
digunakan untuk melihat hubungan antara segugus peubah dependen 
(Yi, Y 2 ,.. Y p ) dengan segugus peubah independen (Xi, X 2 ,., X q ). 

Fokus perhatian dalam analisis korelasi kanonik adalah korelasi 
(hubungan), sehingga pada dasarnya kedua himpunan tidak perlu 
dibedakan menjadi kelompok vaiabel independent dan dependent. 
Pemberian label X dan Y hanya untuk membedakan kedua himpunan 
peubah tersebut. 

Analisis korelasi kanonik berfokus pada korelasi antara kombinasi linear 
dari gugus peubah dependen dengan kombinasi linear dari gugus 
peubah independen. Ide utama dari analisis ini adalah mencari 
pasangan dari kombinasi linear ini yang memiliki korelasi terbesar. 
Pasangan dari kombinasi linear ini disebut fungsi/peubah kanonik dan 
korelasinya disebut korelasi kanonik. 

Tujuan dari analisis korelasi kanonik adalah : 

1. Mengukur tingkat keeratan hubungan antara segugus peubah 
dependen dengan segugus peubah independen 

2. Menguraikan struktur hubungan di dalam gugus peubah dependen 
maupun dalam gugus peubah independen 
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13.2.1. Uji Data dan Uji Asumsi 

Asumsi-asumsi yang harus dipenuhi dalam analisis korelasi kanonik 
adalah (Nugroho, 2008) : 

1. Linieritas, yaitu keadaan dimana hubungan antar peubah 
dependen dengan peubah independen bersifat linier. 

Sebagai contoh : jika ada peubah promosi dan penjualan, maka 
seharusnya korelasi antara kedua peubah bersifat linier. Dalam arti 
makin besar pengeluaran untuk promosi, maka makin tinggi juga 
penjualannya. 

2. Perlunya multivoriate normality untuk menguji signifikansi setiap 
fungsi kanonik. Karena pengujian normalitas secara multivariate sulit 
dilakukan, maka cukup dilakukan uji normalitas untuk setiap peubah. 
Asumsi yang digunakan adalah jika secara individu sebuah peubah 
memenuhi kriteria normalitas, maka secara keseluruhan juga akan 
memenuhi asumsi normalitas. 

3. Tidak ada multikolinearitas antar anggota kelompok peubah, baik 
peubah dependen maupun peubah independen. Sebagai contoh, 
jika peubah dependen terdiri dari penjualan dan biaya produksi, 
maka seharusnya tidak ada korelasi yang kuat dan nyata antara 
peubah penjualan dengan peubah biaya produksi. Jika ada 
korelasi, dinamakan terdapat multikolinieritas. Jika angka korelasi 
tersebut besar maka dapat dilakukan pengurangan salah satu 
peubah, misal salah satu dari peubah penjualan atau biaya produksi 
dapat dihilangkan. 

Adanya beberapa asumsi yang harus dipenuhi pada analisis korelasi 
kanonik, sebelum melakukan analisis perlu dilakukan pengujian untuk 
data yang akan dianalisis dalam dua tahap, yaitu: (1) Uji data dan (2) 
Uji asumsi. Uji data untuk analisis multivariat meliputi: uji data yang tidak 
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lengkap (missing volues ) dan uji data pencilan ( outlier ). Uji asumsi 
meliputi uji normalitas, homoskedastisitas dan linieritas. 

Untuk mendeteksi data pencilan dalam analisis mulitivoriate dilakukan 
dengan menggunakan jarak Mahalanobis (Maha/anob/s D 2 ). Jarak 
Mahalanobis adalah ukuran yang menyatakan jarak nilai setiap kasus 
dari rata-rata seluruh kasus. Jarak Mahalanobis yang besar 
menandakan nilai ekstrem suatu kasus terhadap satu atau lebih 
peubah. 

Uji asumsi linieritas dilakukan dengan melakukan analisis korelasi-regresi 
linier antara peubah independen dan peubah dependen. Uji 
kenormalan dilakukan dengan menggunakan plot distribusi normal dan 
uji Kolmogorof-Smirnov dengan Hipotesis nol (Ho) semua peubah 
berdistribusi normal dan hipotesis tandingannya (Hi) peubah tidak 
normal. Untuk uji homokedasitas dilakukan dengan uji Levene. 

Setelah dilakukan uji asumsi, sebaiknya semua asumsi terpenuhi. 
Dengan kata lain, jika terdapat peubah yang tidak memenuhi asumsi 
maka sebaiknya peubah tersebut dihilangkan/dibuang. Namun hal 
tersebut tidak dengan mudah dapat dilakukan karena pembuangan 
peubah akan menyebabkan tujuan analisis tidak dapat dipenuhi serta 
menyebabkan sifat komposit peubah tidak dapat dipertahankan. 
Transformasi data untuk memperbaiki data, juga harus 
mempertimbangkan makna satuan hasil transformasi. Misalkan jika 
diputuskan untuk melakukan transformasi dengan merubah data 
menjadi log-natural, maka interpretasi hasil tidak lagi melibatkan satuan 
unit asal tetapi sudah melibatkan satuan baru yang dalam banyak 
kasus dapat mengakibatkan kesimpulan yang berbeda. 

Perbaikan data pada analisis multivoriote tidak semudah pada analisis 
univoriote. Seringkali perbaikan data diperlukan untuk peubah yang 
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satu tetapi tidak untuk peubah yang lain. Selain itu perbaikan untuk 
memenuhi asumsi yang satu sering kali menyebabkan asumsi lain 
dilanggar. Praktisnya, tujuan dari dilakukannya uji asumsi adalah agar 
peneliti lebih hati-hati ketika melakukan interpretasi hasil analisis 
daripada sebagai alat untuk menghilangkan peubah atau melakukan 
transformasi data. 


13.2.2. Penentuan Fungsi Kanonik dan Pendugaan 
Koefisien Kanonik 

Penentuan fungsi kanonik bisa dilakukan dengan menggunakan matriks 
covorion atau matriks korelasi. Hal yang membedakan keduanya 
adalah data yang digunakan dalam analisis. Matriks korelasi digunakan 
jika data sudah dibakukan (memiliki satuan yang sama), sedangkan 
matriks covorion menggunakan data sebenarnya (data tidak 
dibakukan dan memiliki satuan yang sama). Proses penentuan fungsi 
kanonik dari kedua jenis matriks tersebut sama. 

1. Penentuan fungsi kanonik dari fungsi covarian 

Misalkan ingin dibuat hubungan antara gugus peubah dependen Y i, Y% 
..., Y p yang dinotasikan dengan vektor peubah acak Y, dengan gugus 
peubah independen Xi, Xz ...,X q yang dinotasikan dengan vektor 
peubah acak X, dimana p<q. 

Misalkan karakteristik dari vektor peubah acak X dan Y adalah sebagai 
berikut: 

E (X) = Mx Cov (Y) = lyy 

E (Y) = My Cov (X) = £* 


Cov(X,Y) = Zxy= (Zyx) f 
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Kombinasi linear dari kedua gugus peubah dapat dituliskan sebagai 
berikut: 

W = o f X = a 1 X 1 + 02X2 +.+a P X q 

V = b f Y = biYi + b 2 V2 + +b q Y P 

Vor (W) = a f Cov(X)a = a f £xxa 
Var (V) = b f Cov(Y)b = b f £ yy b 
Co v (W,V) = a f Cov(X,Y)b = a f l xy b 

Dengan menggunakan ketaksamaan Cauchy-Schwarz atau metode 
langrange, vektor koefisien a dan b dapat diperoleh dengan cara 

mencari p 1 2 > P 2 2 > > p k 2 yang merupakan Akar ciri dari matriks £yy " 1/2 

Xyx Xxx _1 X x y Xyy ^ 2 yang berpadanan dengan vektor ciri fi, f 2 , f k . pi 2 > 

p 2 2 > . > pk 2 juga merupakan akar ciri dari matriks £xx _1/2 £ xy £ yy -i 

1/2 yang berpadanan dengan vektor ciri ei, e 2 , e_k sehingga vektor 
koefisien a dan b_dapat diperoleh sebagai berikut: 


1 




t>1L = Al 



2 = 





Korelasi kanonik diperoleh dengan menghitung : 



d^x, Y t 
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Didefinisikan pasangan pertama dari peubah kanonik adalah kombinasi 
linear WI, VI yang memiliki ragam satu dan korelasi terbesar; pasangan 
kedua dari peubah kanonik adalah kombinasi linear W2, V2 yang 
memiliki ragam satu dan korelasi terbesar kedua serta tidak berkorelasi 
dengan peubah kanonik yang pertama dan pasangan ke-k dari 
peubah kanonik adalah kombinasi linear Wk, Vk yang memiliki ragam 
satu dan korelasinya terbesar ke-k serta tidak berkorelasi dengan 
peubah kanonik 1,2, ..., k-1. 

Dengan demikian dapat dituliskan sebagai berikut: 

• Fungsi Kanonik Pertama : 

Wi = cn f X Var(Wi) = l 

Vi = bi f Y Var(Vi) = l 

maksimum Corr (Wi,Vi) = pi 

• Fungsi Kanonik Kedua : 

W 2 = a 2 t X Var (W 2 ) = 1 Cov (Wi,W 2 ) = 0 

V 2 = b 2 f Y Var (V 2 ) = 1 Cov (Vi ,V 2 ) = 0 

Cov (Wi,V 2 ) =Cov (W 2 ,Vi) = 0 
maksimum Corr (W 2/ V 2 ) = p 2 

• Fungsi Kanonik ke-k 


Wk = a k 'X 

Var (Wk) = 1 

Cov (Wi,W k ) =0 

k ^ 

Vk = WY 

Var (V k ) = 1 

Cov (Vi,Vk) =0 

k ^ 


Cov (Wi ,V k ) =Cov (W k/ Vi) = 0 k ^ 1 

maksimum Corr (Wk,Vk) = pk 
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2. Penentuan fungsi kanonik dari Fungsi Korelasi 


Matriks Korelasi digunakan jika peubah yang akan dianalisis sudah 
dibakukan atau dengan kata lain sudah memiliki satuan yang sama. 
Berikut adalah matriks korelasi dari gugus peubah independen dan 
gugus peubah dependen. 


R = 


R yy 

\ R xy 


R 

R 


yx 

XX J 


Dimana : 

Ryy adalah matriks korelasi sampel y (pxp) 

R yx adalah matriks korelasi sampel antara y dan x (pxq) 

Rxx adalah matriks korelasi sampel x (qxq) 

Vektor Koefisien c dan d diperoleh sbb : 
dari persamaan 

| Ryy- 1 R y xRxx‘ 1 Rxy- r 2 l | =0 dan 

| Rxx _1 RxyRyy _1 Ryx - T 2 I | =0 

diperoleh akar ciri yang sama yaitu n 2 ,r 2 2 , ..., r s 2 tetapi vektor ciri yang 
berbeda yaitu 

(Ryy- 1 RyxRxx- 1 Rxy-r 2 l)C =0 
(Rxx - 1 RxyRyy - 1 Ryx - T 2 I | )d = 0 

Hubungan antara vektor ciri c dan d dengan vektor ciri e dan f yang 
dihasilkan matriks varian kovarian adalah: 
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c = Dyf dan d = D x e 


dimana : D y = diag(S y i,S y 2 , ...,S yp ) 


D x = diag(S x i,Sx 2 , ...,S xq ) 


13.2.3. Perhitungan Proporsi Keragaman 

Besarnya nilai proporsi keragaman menunjukkan baik tidaknya peubah 
kanonik yang dipilih untuk menerangkan keragaman asal. Semakin 
besar nilai proporsi keragaman maka semakin baik peubah-peubah 
kanonik yang dipilih menerangkan keragaman asal. Batasan yang 
digunakan untuk nilai proporsi bersifat relatif, sebagai acuan lebih besar 
dari 70%. 


13.2.4. Uji Hipotesis 

Ada dua hipotesis yang akan diujikan dalam analisis korelasi kanonik 
yaitu uji hipotesis untuk mengetahui apakah secara keseluruhan korelasi 
kanonik signifikan (uji korelasi kanonik secara bersama) dan uji hipotesis 
untuk mengetahui apakah ada sebagian korelasi kanonik signifikan (uji 
individu). Jika uji hipotesis pertama memperoleh kesimpulan bahwa 
paling tidak ada ada satu korelasi kanonik tidak bernilai nol maka 
dilanjutkan dengan uji hipotesis kedua untuk mengetahui apakah ada 
sebagian korelasi kanonik signifikan. 
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1. Uji korelasi kanonik secara bersama 


Hipotesis: 

Ho = pi = p 2 = .= pk =0 (semua korelasi kanonik bernilai nol) 

Hi = ada p/ + 0 (paling tidak ada satu korelasi kanonik 
tidak bernilai nol) 

Statistik uji: B = -[» - \-\{p + </ + l)]lnA 
,E " / \ 

A=ro _ pij dengan: dan nujumlah 

i=1 pengamatan 

Kriteria keputusan : hipotesis nol ditolak pada taraf signifikansi a jika 
B > x 2 a dengan derajat bebas p x q. 

2. Uji individu 

Hipotesis: 

Ho = pi = 0 , p 2 = 0. pk =0 

Hi = pi ± 0, untuk / = /, 2,.. k 

Statistik Uji: 

B, =-[n-l--k{p + q + l)]lnA,. 


dengan : 

A„=n(l-A ! ) 

i=r 


dan n = jumlah pengamatan 

Kriteria keputusan : hipotesis nol ditolak pada taraf signifikansi a jika 
B r > x 2 a dengan derajat bebas (p-r) (q-r). 
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13.2.5. Interpretasi Fungsi Kanonik 

Interpretasi yang dapat dilakukan dalam analisis korelasi kanonik yaitu 
terhadap koefisien kanonik (bobot kanonik / weight kanonik), loadings 
kanonik dan cross loadings kanonik. 

1 . Weight kanonik merupakan koefisien kanonik yang telah dibakukan, 
dapat diinterpretasikan sebagai besarnya kontribusi peubah asal 
terhadap peubah kanonik. Semakin besar nilai koefisien ini maka 
semakin besar kontribusi peubah yang bersangkutan terhadap 
peubah kanonik. 

2. Loadings kanonik dapat dihitung dari korelasi antara peubah asal 
dengan masing-masing peubah kanoniknya. Semakin besar nilai 
loading mencerminkan semakin dekat hubungan fungsi kanonik 
yang bersangkutan dengan peubah asal. Loadings kanonik 
dibedakan menjadi: 

a. Loadings kanonik peubah independen: 

Rxw = Rxx Ai 

b. Loadings kanonik peubah dependen: 

Ryv= RyyBz 

c. Cross loadings kanonik dapat dihitung dari korelasi antara 
peubah asal dengan bukan peubah kanoniknya. Semakin 
besar nilai loading mencerminkan semakin dekat hubungan 
fungsi kanonik yang bersangkutan dengan peubah asal. Cross 
loading kanonik terdiri dari: 

1 ) Cross Loadings kanonik peubah independen: 

R xv = Rxwpk 

2) Cross Loadings kanonik peubah dependen: 

Ryw = Ryv pk 


304 



13.2.6. Redundansi 


Redundansi adalah suatu indeks yang menghitung proporsi keragaman 
yang dapat dijelaskan oleh peubah kanonik yang dipilih, baik dari 
peubah kanonik dependen maupun peubah kanonik independen. 
Proporsi keragaman dapat dibedakan menjadi: 

1 . Proporsi keragaman Y yang diterangkan oleh peubah kanonik V : 

r <3 


O 2 

^z m \v Is v 2r .. a v r 




;=i k=i 


2. Proporsi keragaman Y yang diterangkan oleh peubah kanonik W : 

p- — n 2 u- 

3. Proporsi keragaman X yang diterangkan oleh peubah kanonik W : 

r p 


Z Z'V 




1=1 k=l 


Cl) 

i ^Jr 


"Z^\w v ,w 2 . w r p 

4. Proporsi keragaman X yang diterangkan oleh peubah kanonik V : 

R rnx\r = Pi R < 


’l 4)* 


Koefisien R-square digunakan untuk menentukan fungsi kanonik yang 
dianggap cukup untuk menerangkan struktur hubungan Y dan X. Nilai ini 
diperoleh dengan mengkuadratkan korelasi kanonik yang dinotasikan 
sebagai berikut: 


Rk 2 = p t 2 
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13.2.7. Validasi Fungsi Kanonik 

Validasi perlu dilakukan sebelum mengambil kesimpulan untuk kasus 
yang dihadapi. Tahap ini dilakukan untuk meyakinkan bahwa hasil yang 
telah diperoleh sebelumnya bersifat umum. Atau dengan kata lain, 
tahap ini dapat mengidentifikasikan tingkat kestabilan dari fungsi 
kanonik yang diperoleh. Jika loading kanonik stabil maka dapat 
dikatakan bahwa fungsi kanonik yang diperoleh sudah valid unuk 
menarik kesimpulan. 

Berikut ini adalah beberapa metode validasi yang dapat digunakan : 

1. Membagi sampel menjadi dua bagian, bagian pertama digunakan 
untuk menduga fungsi kanonik dan bagian kedua digunakan 
sebagai validasi. 

2. Analisis sensitivitas untuk peubah-peubah independen, yaitu dengan 
membandingkan loading kanonik apabila salah-satu dari peubah 
independen disisihkan dari analisis. 

13.3. Ilustrasi 

Survey HATCO dilakukan terhadap 100 responden yang merupakan 
manajer pembelian dari perusahaan-perusahaan yang membeli 
barang di HATCO. Tujuan survey ini adalah ingin mengetahui persepsi 
terhadap perusahaan HATCO sebagai perusahaan pemasok ( supplier ) 
berdasarkan hasil pembelian. Peubah-peubah yang menggambarkan 
persepsi terhadap perusahaan telah diidentifikasi pada studi 
sebelumnya terdiri dari 7 peubah yang paling berpengaruh yaitu : 

XI : Kecepatan Pengantaran (waktu yang dibutuhkan 
untuk mengantarkan produk setelah perintah telah 
dikonfirmasi) 

X2 : Tingkat Harga 
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X3 : Fleksibilitas Harga (persepsi mengenai kesediaan 
perwakilan HATCO untuk menegosiasikan harga pada 
semua jenis pembelian) 

X4 : Citra Pabrik Pembuat (gambaran secara menyeluruh 
mengenai perusahaan HATCO sebagai supplier ) 

X5 : Layanan Keseluruhan (keseluruhan tingkat layanan yang 
diperlukan untuk mempertahankan hubungan yang 
memuaskan antara pemasok dan 

pembeli) 

X6 : Citra Tenaga Penjual 

X7 : Kualitas Produk (persepsi tingkat kualitas produk tertentu 
misalnya: kinerja atau hasil) 

Peubah XI-X7 dalam selang kontinu 0 s.d. 10 dimana 0 = buruk 

dan 10 = sangat baik 

Hasil pembelian terdiri dari 2 peubah yang diperoleh dari hasil evaluasi 
kepuasan masing-masing responden terhadap HATCO dan persentase 
pembelian produk yang dibeli responden yaitu : 

X9 : Tingkat Penggunaan (berapa banyak produk total 
perusahaan yang dibeli dari HATCO, diukur 
berdasarkan persentase dengan skala 100, mulai dari 0 
hingga 100 persen 

XI0 : Tingkat Kepuasan (seberapa puas pembeli dengan 

pembelian terakhir dari HATCO, diukur dengan rating 
skala seperti pada XI untuk X7) 
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ID 

Responden 

Peubah Independen 


Peubah Dependen 

XI 

X 2 

X 3 

X 4 

X 5 

X 6 

X 7 

X 8 

X 9 

X 10 

30,0 

4,1 

3,7 

5,9 

5,5 

3,9 

3,0 

8,4 

1 

46,0 

5,1 

31,0 

3,0 

3,2 

6,0 

5,3 

3,1 

3,0 

8,0 

1 

43,0 

3,3 

32,0 

2,8 

3,8 

8,9 

6,9 

3,3 

3,2 

8,2 

0 

53,0 

5,0 

33,0 

5,2 

2,0 

9,3 

5,9 

3,7 

2,4 

4,6 

0 

60,0 

6,1 

34,0 

3,4 

3,7 

6,4 

5,7 

3,5 

3,4 

8,4 

1 

47,0 

3,8 

35,0 

2,4 

1,0 

7,7 

3,4 

1,7 

1,1 

6,2 

1 

35,0 

4,1 

36,0 

1,8 

3,3 

7,5 

4,5 

2,5 

2,4 

7,6 

1 

39,0 

3,6 

37,0 

3,6 

4,0 

5,8 

5,8 

3,7 

2,5 

9,3 

1 

44,0 

4,8 

38,0 

4,0 

0,9 

9,1 

5,4 

2,4 

2,6 

7,3 

0 

46,0 

5,1 

39,0 

0,0 

2,1 

6,9 

5,4 

1,1 

2,6 

8,9 

1 

29,0 

3,9 

40,0 

2,4 

2,0 

6,4 

4,5 

2,1 

2,2 

8,8 

1 

28,0 

3,3 

41,0 

1,9 

3,4 

7,6 

4,6 

2,6 

2,5 

7,7 

1 

40,0 

3,7 

42,0 

5,9 

0,9 

9,6 

7,8 

3,4 

4,6 

4,5 

0 

58,0 

6,7 

43,0 

4,9 

2,3 

9,3 

4,5 

3,6 

1,3 

6,2 

0 

53,0 

5,9 

44,0 

5,0 

1,3 

8,6 

4,7 

3,1 

2,5 

3,7 

0 

48,0 

4,8 

45,0 

2,0 

2,6 

6,5 

3,7 

2,4 

1,7 

8,5 

1 

38,0 

3,2 

46,0 

5,0 

2,5 

9,4 

4,6 

3,7 

1,4 

6,3 

0 

54,0 

6,0 

47,0 

3,1 

1,9 

10,0 

4,5 

2,6 

3,2 

3,8 

0 

55,0 

4,9 

48,0 

3,4 

3,9 

5,6 

5,6 

3,6 

2,3 

9,1 

1 

43,0 

4,7 

49,0 

5,8 

0,2 

8,8 

4,5 

3,0 

2,4 

6,7 

0 

57,0 

4,9 

50,0 

5,4 

2,1 

8,0 

3,0 

3,8 

1,4 

5,2 

0 

53,0 

3,8 

51,0 

3,7 

0,7 

8,2 

6,0 

2,1 

2,5 

5,2 

0 

41,0 

5,0 

52,0 

2,6 

4,8 

8,2 

5,0 

3,6 

2,5 

9,0 

1 

53,0 

5,2 

53,0 

4,5 

4,1 

6,3 

5,9 

4,3 

3,4 

8,8 

1 

50,0 

5,5 

54,0 

2,8 

2,4 

6,7 

4,9 

2,5 

2,6 

9,2 

1 

32,0 

3,7 

55,0 

3,8 

0,8 

8,7 

2,9 

1,6 

2,1 

5,6 

0 

39,0 

3,7 

56,0 

2,9 

2,6 

7,7 

7,0 

2,8 

3,6 

7,7 

0 

47,0 

4,2 

57,0 

4,9 

4,4 

7,4 

6,9 

4,6 

4,0 

9,6 

1 

62,0 

6,2 

58,0 

5,4 

2,5 

9,6 

5,5 

4,0 

3,0 

7,7 

0 

65,0 

6,0 

59,0 

4,3 

1,8 

7,6 

5,4 

3,1 

2,5 

4,4 

0 

46,0 

5,6 

60,0 

2,3 

4,5 

8,0 

4,7 

3,3 

2,2 

8,7 

1 

50,0 

5,0 

61,0 

3,1 

1,9 

9,9 

4,5 

2,6 

3,1 

3,8 

0 

54,0 

4,8 

62,0 

5,1 

1,9 

9,2 

5,8 

3,6 

2,3 

4,5 

0 

60,0 

6,1 

63,0 

4,1 

1,1 

9,3 

5,5 

2,5 

2,7 

7,4 

0 

47,0 

5,3 

64,0 

3,0 

3,8 

5,5 

4,9 

3,4 

2,6 

6,0 

0 

36,0 

4,2 

65,0 

1,1 

2,0 

7,2 

4,7 

1,6 

3,2 

10,0 

1 

40,0 

3,4 
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Hasil Analisis 


Berikut adalah beberapa hasil yang diperoleh dalam analisis korelasi 
kanonik (diperoleh menggunakan program SAS). 

1. Nilai Korelasi Pearson Antar Peubah Dependen, Antar Peubah 
Independen Dan Korelasi Silang Antara Peubah Dependen Dengan 
Independen 


Hasil Analisis Korelasi Kanonik 
The CANCORR Procedure 


Correlations Among the Original Variables 
Correlations Among the VAR Variables 

X9 XI0 





X9 

1.0000 







X10 


1.0000 





Correlations 

Among the 

WITH Variables 




XI X2 


X3 X4 

X5 

X6 

X7 


XI 

1.0000 

-0.3492 

0.5093 

0.0504 

0.6119 

0.0771 

-0.4826 

X2 

-0.3492 

1.0000 

-0.4872 

0.2722 

0.5130 

0.1862 

0.4697 

X3 

0.5093 

-0.4872 

1.0000 

-0.1161 

0.0666 

■0.0343 

-0.4481 

X4 

0.0504 

0.2722 

-0.1161 

1.0000 

0.2987 

0.7882 

0.2000 

X5 

0.6119 

0.5130 

0.0666 

0.2987 

1.0000 

0.2408 

-0.0552 

X6 

0.0771 

0.1862 

-0.0343 


0.2408 

1.0000 

0.1773 

X7 

-0.4826 

0.4697 

-0.4481 

0.2000 

-0.0552 

0.1773 

1.0000 


Correlations Between the VAR Variables and the WITH Variables 


XI X2 X3 X4 X5 


X6 


X7 


X9 0.6765 0.0819 0.5590 0.2242 0.2561 -0.1925 

X10 0.6506 0.0284 0.5248 0.4759 0.3409 -0.2833 


Dari nilai korelasi antar peubah dependen terlihat bahwa ada 
hubungan linear yang erat antara Tingkat Penggunaan (X9) dan 
Tingkat Kepuasan (XI0). Sedangkan korelasi antar peubah 
independen terlihat bahwa ada hubungan linear yang erat antara 
Citra Pabrik Pembuat(X4) dengan Citra Tenaga Penjual(X6). 
Hubungan linear yang paling rendah terjadi antara Fleksibilitas 
Harga (X3) dengan Citra Tenaga Penjual(X6). 
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Korelasi antar peubah dependen dengan peubah independen 
terlihat bahwa peubah Tingkat Penggunaan (X9) dan Tingkat 
Kepuasan (XI0) memiliki hubungan linear yang cukup erat dengan 
Kecepatan Pengantaran (XI) dan Layanan Keseluruhan (X5). 
Sedangkan hubungan antar peubah yang lainnya terlihat tingkat 
hubungan linearnya relatif rendah. 


2 . 


Korelasi Kanonik 

Korelasi kanonik dari gugus peubah dependen dengan peubah 
independen menghasilkan 2 fungsi kanonik. Korelasi kanonik 
pertama sebesar 0.937 dan kedua sebesar 0.51. Dari hasil tersebut 
menunjukkan bahwa korelasi kanonik yang cukup besar terjadi 
pada fungsi kanonik pertama. 


Squaned 

Canonical 

Correlation 


Canonical Correlation Analysis 
Adjusted 

Canonical Canonical 

Correlation Correlation 


Approximate 

Standard 

Error 


1 0.936913 


0.932812 


0.012281 


3. Inferensia 

Untuk memilih jumlah fungsi kanonik yang cukup digunakan untuk 
menjelaskan hubungan antara gugus peubah dependen dengan 
independen dapat dilihat dari kontribusi keragaman kumulatif yag 
dijelaskan oleh fungsi kanonik atau berdasarkan uji statistik. 


Berdasarkan kontribusi keragaman yang dijelaskan oleh fungsi 
kanonik terlihat bahwa fungsi kanonik pertama menjelaskan 
keragaman total sebesar 95.33% sedangkan yang kedua sebesar 
4.67%. Hasil ini menunjukkan bahwa untuk menerangkan 
keragaman total cukup mengambil fungsi kanonik pertama saja. 
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Berdasarkan uji rasio kemungkinan terlihat bahwa korelasi kanonik 
pertama dan kedua berbeda nyata pada a=0.05. Hal ini berarti 
korelasi kanonik yang dapat digunakan untuk menjelaskan 
hubungan antar gugus peubah dependen dan independen 
adalah dua korelasi kanonik. 

Pengujian korelasi kanonik secara simultan menunjukkan bahwa 
paling sedikit ada satu korelasi kanonik yang nyata. Dengan 
demikian dari kedua metode pengujian diatas dapat disimpulkan 
bahwa korelasi kanonik yang dipilih adalah dua korelasi kanonik. 


Test of H0: The canonical correlations in 

the current 

row and all 

. that follow are 

zero 


Eigenvalues of Inv(E)*H = CanRsq/(l-CanRsq) 




Eigenvalue Diffenence 

Proportion 

Cumulative 

Likelihood 

Ratio 

Approximate 

F Value Num DF Den 

DF Pr 

> F 

1 7.1837 6.8321 


0.9533 

0.09040876 

30.24 

14 

182 

<.0001 

2 0.3516 

0.0467 

1.0000 

0.73987709 

5.39 

6 

92 

<.0001 


Multivariate Statistics 

and F Approximations 






S=2 M=2 

N=44.5 





Statistic 


Value 

F Value 

Num DF 

Den DF 

Pr > F 


Wilks' Lambda 


0.09040876 

30.24 

14 

182 

<.0001 


Pillai's Trace 


1.13792861 

17.35 

14 

184 

hph 


Hotelling-Lawley Trace 

7.53526400 

48.59 

14 

142.28 

<.0001; 


Roy's Greatest Root 

7.18368817 

94.41 

7 

92 

<.@001 


NOTE: F 

Statistic 

for Roy's Greatest Root is an upper 

bound. 




NOTE: F Statistic for Wilks' Lambda 

is exact. 
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4. Bentuk Kedua Fungsi Kanonik 

Berdasarkan koefisien kanonik yang telah dibakukan untuk fungsi 
kanonik dependen terlihat bahwa urutan kontribusi relatif peubah- 
peubah dependen terhadap variate pertama adalah XI0 dan X9. 
Urutan kontribusi relatif peubah-peubah dependen terhadap 
variate kedua adalah X9 dan XI0. 


Berdasarkan koefisien kanonik yang telah dibakukan untuk fungsi 
kanonik independen terlihat bahwa urutan kontribusi relatif peubah- 
peubah independen terhadap variate pertama adalah 

X3,X5,X4,X1 ,X2,X6 dan X7. Urutan kontribusi relatif peubah-peubah 
dependen terhadap variate kedua adalah X5,X4,X1 ,X2,X6,X7dan 
X3. 


j Canonical Correlation Analysis 


Raw Canonical Coefficients for the VAR Variables 


VI 

V2 

X9 

0.0556978517 

0.1480049728 

X10 

0.6780451833 

-1.516799589 

Raw Canonical Coefficients for 

the IaIITH Variables 


W1 

W2 

XI 

0.1702660392 

-0.730470504 

X2 

0.0860216803 

-0.725990627 

X3 

0.4100729309 

0.1151226504 

X4 

0.3075988599 

-1.286602814 

X5 

0.5927979812 

2.0371773018 

X6 

-0.065847588 

0.9550978687 

X7 

0.0004309902 

0.301249326 

Canonical Correlation Analysis 


Standardized Canonical Coefficients for the 

VAR Variables 


VI 

V2 

X9 

0.5007 

1.3304 

X10 

0.5801 

-1.2977 

Standardized Canonical Coefficients for the 1 

aIITH Variables 


W1 

W2 

XI 

0.2249 

-0.9648 

X2 

0.1029 

-0.8680 

X3 

0.5686 

0.1596 

X4 

0.3480 

-1.4557 

X5 

0.4453 

1.5304 

X6 

-0.0508 

0.7362 

X7 

0.0007 

0.4776 


5. Korelasi Antara Setiap Peubah Dengan Fungsi Kanoniknya (Looding 
Kanonik) 
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Untuk fungsi kanonik peubah-peubah dependen terlihat bahwa 
peubah yang berhubungan paling erat dengan fungsi kanonik 
pertama adalah X9 dan XI0 sedangkan terhadap fungsi kanonik 
kedua yaitu X9. Untuk fungsi kanonik peubah independen terlihat 
bahwa peubah-peubah yang berhubungan paling erat dengan 
fungsi kanonik pertama adalah XI,X3 dan X5 sedangkan terhadap 
fungsi kanonik kedua yaitu X4. 





Canonical Structure 



Correlations 

Between the VAR 

Variables and Their Canonical 

Variables 






VI 

V2 





X9 

X10 



0.4081 

-0.3522 



Correlations 

Between the 

WITH 

Variables and Their Canonical 

Variables 






W1 

W2 





XI 



0.1091 





X2 

0 

.0614 

0.1414 





X3 



0.1229 





X4 

0.4145 






X5 



0.2216 





X6 

0 

.3479 

-0.1995 





X7 

-0 

.2783 

0.2189 


Correlations 

Between 

the VAR 

Variables 

and the Canonical Variables of the IaIITH Variables 






W1 

W2 





X9 

X10 



-0.1796 


Correlations 

Between 

the WITH Variables 

and the Canonical Variables of the 

VAR Variables 






VI 

V 2 





XI 



0.0556 





X2 

0 

.0575 

0.0721 





X3 

0 

.5843 

0.0627 





X4 

0 

.3883 






X5 



0.1130 





X6 

0 

.3260 

-0.1017 





X7 

-0 

.2607 

0.1116 



Dari korelasi silang antar peubah-peubah dependen terhadap 
fungsi kanonik peubah independen terlihat bahwa yang 

berhubungan paling erat dengan fungsi kanonik pertama adalah 
X9 dan XI0 serta terhadap fungsi kanonik kedua adalah X9. 

Dari korelasi silang antar peubah-peubah independen terhadap 
fungsi kanonik peubah dependen terlihat bahwa yang 
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berhubungan paling erat dengan fungsi kanonik pertama adalah 
XI dan X5 serta terhadap fungsi kanonik kedua adalah X4. 

6. Redudansi 

Dari hasil analisis redudansi terlihat bahwa cukup korelasi kanonik 
pertama saja yang digunakan karena R 2 kanonik untuk fungsi 
kanonik kedua kecil yaitu 26.01%. 



Canonical Redundancy Analysis 




Raw Variance of 

the VAR Variables 

Explained by 


Their 

Own 



The Opposite 


Canonical Variables 


Canonical Variables 

Canonical 






Variable 


Cumulative 

Canonical 


Cumulative 

Number 

Proportion 

Proportion 

R-Square 

Proportion Proportion 

1 

0.8338 

0.8338 



0.7319 0.7319 

2 

0.1662 

1.0000 

0.2601 


0.0432 0.7752 


Raw 

Variance of 

the WITH Variables 

Explained by 


Their 

Own 



The Opposite 


Canonical 

Variables 



Canonical Variables 

Canonical 






Variable 


Cumulative 

Canonical 


Cumulative 

Number 

Proportion 

Proportion 

R-Square 

Proportion Proportion 

1 

0.2577 

0.2577 



0.2262 0.2262 

2 

0.0748 

0.3325 

0.2601 


0.0195 0.2457 
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Canonical Redundancy Analysis 


Canonical 

Vaniable 

Standardized Variance of the 
Their Own 

Canonical Variables 

Cumulative 

VAR Variables 

Canonical 

Explained by 

The Opposite 
Canonical Variables 

Cumulative 

Number 

Pnoportion 

Proportion 

R-Square 

Proportion 

Proportion 

1 

0.8547 

0.8547 


0.7503 

0.7503 

2 

0.1453 

1.0000 

0.2601 

0.0378 

0.7881 


Canonical 

Variable 

Standardized Variance of the 
Their Own 

Canonical Variables 

Cumulative 

IaIITH Variables 

Canonical 

Explained by 

The Opposite 
Canonical Variables 

Cumulative 

Number 

Proportion 

Proportion 

R-Square 

Proportion 

Proportion 

1 

0.2761 

0.2761 


0.2424 

0.2424 

2 

0.0823 

0.3584 

0.2601 

0.0214 

0.2638 


7. Validasi Hasil 

Validasi hasil untuk kasus ini menggunakan metode analisis 
sensitivitas untuk peubah-peubah independen, yaitu dengan 
membandingkan loading kanonik apabila salah-satu dari peubah 
independen disisihkan dari analisis. Hasil analisis sebelumnya akan 
valid jika penyisihan salah satu peubah independen tersebut tetap 
menghasilkan korelasi kanonik yang stabil. 

Banyaknya peubah dalam kasus ini menyebabkan pilihan peubah 
yang dapat disisihkan sangat banyak. Hair,et.al (1995) melakukan 
penyisihan peubah pada XI, X2 dan X7 dan menyatakan tidak 
terjadi perubahan kekuatan dan koefisien korelasi kanonik. Selain itu 
menyimpulkan juga bahwa tiga peubah dalam kelompok persepsi 
terhadap perusahaan yang terpenting adalah XI ,X3 dan X5. 

Dalam tulisan ini,uji sensitivitas akan dilakukan dengan menyisihkan 3 
peubah yaitu XI, X2 dan X5. Hasil yang dimuat dalam Tabel 1 
menunjukkan adanya stabilitas model korelasi kanonik serta 
dengan mengikuti analisis Hair,et.al (1995), analisis ini juga 
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menunjukkan bahwa tiga peubah dalam kelompok persepsi 
terhadap perusahaan yang paling penting adalah XI,X3 dan X5. 


Tabel 1 Hasil Analisis Sensitivitas Korelasi Kanonik 



Complete 

Hasil Setelah Penyisihan peubah 


Variate 

XI 

X2 

X5 

1 1 

2 

3 

4 

5 

Korelasi Kanonik (R) 

0.937 

0.936 

0.937 

0.934838 

Root Kanonik (R 2 ) 

0.878 

0.877 

0.878 

0.873922 

Peubah Independen 

XI Kecepatan 

Pengantaran 

0.764 

dihilangkan 

0.765 

0.7653 

X2 Tingkat Harga 

0.061 

0.062 

dihilangkan 

0.0606 

X3 Fleksibilitas Harga 

0.624 

0.624 

0.624 

0.6242 

X4 Citra Pabrik 

Pembuat 

0.414 

0.413 

0.414 

0.4194 

X5 Layanan 

Keseluruhan 

0.765 

0.766 

0.766 

dihilangkan 

X6 Citra Tenaga 

Penjual 

0.348 

0.348 

0.348 

0.3499 

X7 Kualitas Produk 

-0.278 

-0.278 

-0.278 

-0.2803 

shared variance 

0.2761 

0.225 

0.3216 

0.2260 

Redudansi 

0.2424 

0.1972 

0.2822 

0.1975 

Peubah dependen 

Loading kanonik 

X9 Tingkat 

Penggunaan 

0.913 

0.915 

0.914 

0.9080 

XI0 Tingkat Kepuasan 

0.936 

0.934 

0.935 

0.9400 

shared variance 

0.8547 

0.8549 

0.8548 

0.8541 

Redudansi 

0.7503 

0.7479 

0.7501 

0.7464 


Berdasarkan hasil analisis di atas, persepsi terhadap perusahaan HATCO 
khususnya kecepatan pengantaran, fleksibilitas harga dan layanan 
berhubungan erat dengan hasil pembelian dilihat dari tingkat 
kepuasaan dan tingkat penggunaan. 
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13.4. Aplikasi SAS 

Berikut adalah program SAS dari data seperti pada ilustrasi di atas. 

DATA HATCO; 

INPUT ID XI X2 X3 X4 X5 X6 X7 X8 X9 XI0 XI1 X12X13X14; 


DATALINES; 


1 

4.1 

0.6 

6.9 

4.7 

2.4 

2.3 

5.2 

0 

32 

4.2 

1 

0 

1 

1 

2 

1.8 

3 

6.3 

6.6 

2.5 

4 

8.4 

1 

43 

4.3 

0 

1 

0 

1 

3 

3.4 

5.2 

5.7 

6 

4.3 

2.7 

8.2 

1 

48 

5.2 

0 

1 

1 

2 

4 

2.7 

1 

7.1 

5.9 

1.8 

2.3 

7.8 

1 

32 

3.9 

0 

1 

1 

1 

5 

6 

0.9 

9.6 

7.8 

3.4 

4.6 

4.5 

0 

58 

6.8 

1 

0 

1 

3 

97 

6.1 

0.5 

9.2 

4.8 

3.3 

2.8 

7.1 

0 

60 

5.2 

1 

0 

1 

3 

98 

2 

2.8 

5.2 

5 

2.4 

2.7 

8.4 

1 

38 

3.7 

0 

1 

0 

1 

99 

3.1 

2.2 

6.7 

6.8 

2.6 

2.9 

8.4 

1 

42 

4.3 

0 

1 

0 

1 

100 

2.5 

1.8 

9 

5 

2.2 

3 

6 

0 

33 

4.4 

1 

0 

0 

1 


Title 'Hasil Analisis Korelasi Kanonik'; 

Proc cancorr REDUNDANCY corr data=HATCO; 
var X9 XI0; 

with XI X2X3X4X5 X6 X7; 

run; 
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14 


14.Analisis Regresi Peubah Ganda (Multivariate 
Regression Analysis ) 


14.1. Pendahuluan 

Pada saat sekarang, perkembangan penelitian pada bidang 
ekonometrika, pendidikan, psikometrika, dan beberapa bidang ilmu 
pengetahuan sosial lainnya, tertarik pada pemodelan hubungan yang 
relatif rumit. Pemodelan hubungan tersebut dibentuk melalui satu atau 
lebih peubah tak bebas yang dijelaskan oleh satu atau lebih peubah 
bebas, dan pada saat yang bersamaan satu atau lebih peubah tak 
bebas tersebut berperan sebagai peubah bebas bagi peubah tak 
bebas lainnya. 

Peubah-peubah pada model hubungan yang relatif rumit tersebut 
dapat berupa peubah terukur maupun peubah tak terukur (peubah 
laten). Peubah terukur pada model hubungan tersebut dapat langsung 
diketahui nilai/besarnya melalui suatu pengamatan, sedangkan untuk 
peubah laten nilai/besarnya dibangun melalui beberapa peubah 
monifesf (penjelas) yang diasumsikan merupakan indikator (pengukur) 
bagi peubah laten. 

Model hubungan yang relatif rumit dengan sebagian atau seluruh 
peubah-peubahnya berupa peubah laten, menyulitkan peneliti dalam 
menganalisis keterkaitan hubungan antar peubah-peubah laten 
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tersebut. Kesulitan ini disebabkan karena pendugaan terhadap model 
hubungan antar peubah laten dan pengujian terhadap model 
dugaannya tidak dapat dilakukan menggunakan analisis regresi secara 
simultan (pada waktu yang bersamaan). Kesulitan inilah yang menuntun 
peran statistikawan untuk mengembangkan suatu teknik analisis yang 
dapat membantu dalam menyelesaikan permasalahan tersebut. Oleh 
karena itu, banyak analisis statistika yang berkembang pesat untuk 
mengatasi hal tersebut yaitu salah satunya dengan menggunakan 
analisis regresi multivariate yang mana dalam regresi ini terdapat 
beberapa variabel y dan beberapa variabel x dimana variabel y saling 
berhubungan sehingga harus terdapat besarnya korelasi antara 
variabel y tersebut untuk menentukan persamaan structural yang dapat 
menginformasikan secara lebih spesifik. 


14.2. Analisis Regresi 

Berdasarkan jumlah variable bebas dan tak bebas yang dilibatkan 
dalam analisis regresi, analisis regresi dapat dibedakan menjadi analisis 
regresi linear sederhana, analisis regresi linear berganda, dan analisis 
regresi linear multivariate. Secara umum gambaran mengenai 
perbedaan regresi linear, regresi berganda dan regresi multivariate 
dapat di lihat sbb : 

Regresi linier sederhana : hanya terdiri dari satu y dan 

satu x. sebagai contoh : dalam suatu universitas meramalkan 
IPK mahasiswa berdasarkan pada nilai-nilai yang ada di SMA. 
Regresi linier berganda : terdiri dari satu y dan 

beberapa x. Kita dapat meningkatkan prediksi IPK mahasiswa 
menggunakan lebih dari satu variabel x. Contohnya nilai SMA, 
standar nilai, peringkat SMA. 
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Regresi linier multivariate: terdiri beberapa y dan beberapa x. 
pada ilutrasi di atas, kita dapat menduga y. tetapi dalam hal ini, 
variabel y dapat diregresikan kembali dengan variabel x. 


14.3. Analisis Regresi Multivariate 

Analisis multivariat adalah analisis statistika yang dikenakan pada data 
yang terdiri dari banyak variable dan antar variable saling berkorelasi. 
Data multivariat tidak hanya terdiri dari satu variable saja melainkan 
dapat terdiri atas lebih dari satu variabel. Misal data dari n pengamatan 
pada p variabel sehingga dapat disusun matriks dengan n baris dan p 
kolom, dinotasikan X sbb (Morrison, 2005) : 



■*11 

Xl2 " 

■ Xi p - 

X = 

X 21 

x 22 ■■ 

■ x 2p 


x nl 

x n2 

x np. 


Model regresi multivariat adalah model regresi dengan lebih dari satu 
variabel respon yang saling berkorelasi dan satu atau lebih variabel 
predictor (Johnson dan Wichern, 2007; Rencher 2002). Terdapat 2 tipe 
dasar variabel x pada regresi multivariate yaitu x yang tetap dan x yang 
random/acak. Pada ilustrasi di atas, variabel x adalah bersifat random 
karena semuanya tidak dapat di kontrol oleh peneliti. Apabila 
seseorang memilih x sebagai random, maka semua variabel x dan 
variabel y dapat diukur dan diamati. 

Dalam beberapa kasus percobaan, variabel x adalah bersifat tetap, di 
bawah pengawasan peneliti. Sebagai contoh, peneliti ingin 
menghubungkan lahan per hektar dan nilai nutrisi untuk beberapa 
tingkat pupuk buatan yang diberikan. Peneliti dapat memilih jumlah 
kimia yang diberikan dan kemudian mengamati perubahan respon 
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pada lahan dan nutrisi yang diberikan tersebut. Dalam makalah ini, 
hanya membahas tentang variabel x yang bersifat tetap. 

Misalkan terdapat variabel respon berjumlah q yaitu Y 1 ,Y 2 ,...,Y q dan p 
variabel predictor yaitu X lf X 2 , ...,X P , maka model linear multivariate 
respon ke-q adalah : 


Y± = /? 01 + p 02 X 1 H-1- p pl X p + £ ± 


Y 2 - Po2 + Pl2 X l + ■■■ + Pp2 X p + 


Y q ~ Poq + Plq%l -h PpqX p + £q 

Model regresi multivariate yang terdiri dari q model linear secara 
simultan dapat ditunjukkan bentuk matriks pada persamaan sbb : 

Y(nxq) = X n x(p+l)P(p+l)xq "k £ (nxq) dengCLTl dSUTTLSi . 


E (^(i;)) = 0 untuk i = 1,2,..., n. 
var(£i) = 0 untuk i = 1,2,..., n. dan 


Coy(£(i)£(i)) = ani , untuk i j 


Asumsi 1 menyatakan bahwa model adalah linier dan tidak ada 
penambahan kondisi yang dibutuhkan untuk menduga y, semua variasi 
yang tertinggal adalah y yang murni bersifat random dan tidak dapat 
diduga. Kemudian jika = 0 dan x bersifat tetap, maka E{y{) = 

Po + PiXn+P 2 Xi 2 +PqXiq, dan rata-rata y menggambarkan kondisi dari x 
tanpa ada penambahan. Asumsi 2, variansi pada setiap a adalah sama 
yang mana berimplikasi bahwa var(yi)=a 2 , ketika x bersifat tetap. Asumsi 
3 ditimbulkan oleh kondisi yang errornya tidak berkorelasi, dari 
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pernyataan yang disampaikan menyatakan bahwa y juga tidak 
berkorelasi yaitu cov (y\, yj)=0. 

Sehingga 3 asumsi diatas dapat diubah kedalam kondisi y sbb : 

E (y i) — Po + P2 x i2~^ Pq x iq > 1 '2/-,n. 

var(yi)=a 2 , i=l, 2, ..., n. 
cov (yi, yj) =0, untuk semua \f\. 

Apabila menggunakan notasi matriks, model untuk n observasi dapat 
dituliskan sbb: 


fyi\ 

y 2 

\yj 


d 


Xn X 12 ... 
X 21 *22 ■ 






x nl x n2 *’* x r 


J 


Atau dapat dituliskan y=X(3+£. 


Berdasarkan pada notasi tersebut, 3 asumsi di atas menjadi: 

1. E(e)=0 

2. Cov (z) -a 2 1 

Yang mana dapat dituliskan dalam kondisi y sbb : 

1. E(y) = X(3 

2. Cov(y) = a 2 l 


> Jumlah Kuadrat Sisaan 

Untuk menduga (3o,(3i, ... ,(3 q yaitu dengan meminimumkan 
jumlah kuadrat sisaan n pengamatan y dari nilai modelnya, yaitu dari 
nilai y t di duga menggunakan model. Sehingga dapat dilihat sbb : 
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ssE = rU^ = lU (y;-y.) 2 

— Yii=i(yi — Po — Pl^il — @2 x i2 — *•• — ftqXiq) 

Sehingga nilai dugaan (3 dapat diberikan sbb : 

P = (X'X)~ 1 X'y 

> Penduga a 2 

Ditunjukkan bahwa, 

E (SSE ) = a 2 [n - (q + 1)] = a 2 (n — q — 1) 

Sehingga penduga tak bias dari a 2 adalah sebagai berikut: 

S 2 = — - =--—r (y - xp)‘(y - xp) 

n-q -1 n-q-l w JK J 

Dimana SSE dalam bentuk 

SSE — yy — P'X'y 

> Rata-rata Model Terkoreksi 

Terkadang variabel x menggunakan rataan data tersebut. Seperti 
*i = £f= = Yi=iXi 2 /n, sehingga model menjadi 

yi = <2 + x l) + $2(Xi2 — X2) H- V Pq(Xiq ~Xq)+ 

Dimana 

a — A) + A- V J + &2 X 2 H-r ■ 

Untuk menduga |5i, maka : 
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(Z\ 


} 


Dan menggunakan matrik x pusat sbb : 


( tll -Jfi x n -X2 ■ 
■f 21 - *I *22 - *2 ■ 

* 5"! 

■ 1 1 
J*\ J* 1 


(*1 - K)' \ 
(\2 — 

V X n2 -X 2 ■ 

■■ x ng X q J 


^ (X n - X)' ) 


Sehingga penduga (3i adalah sbb : 

01 =(X^X c )" 1 x;y. 

> Pengujian kebebasan Antar Variabel Respon 

Variabel Y lf ... ,Y 2 ,... ,Y q dikatakan bersifat saling bebas 
(independen) jika matriks korelasi antar variabel membentuk matriks 
identitas. Untuk menguji kebebasan antar variabel ini dapat dilakukan 
uji Barlett Sphericity berikut (Morrison, 2005) : 

Hipotesis: 

H 0 : Antar variabel respon bersifat independen 

Hi : Antar variabel respon bersifat dependen 

Statistik Uji: 




hitung 


\n — 1 — 


2q + 5 
6 
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Dimana q adalah jumlah variabel respon dan In |f?|adalah nilai-nilai 
determinan matrik korelasi dari masing-masing variabel respon. Gagal 
tolak Ho jika xl itung < x\ q ^ q+1 ^ yang berarti antar variabel bersifat 

independen. 

> Kullback’s Information Criterion Corrected (KICc) 


Menurut Hafidi dan Mkhadri (2006) criteria KICc merupakan 
koreksi dari metode KICc dan akan menghasilkan model terbaik jika 
digunakan pada sampel kecil untuk pemilihan model linear multivariate. 
Hafidi dan Mkhadri (2006) menyatakan bahwa besarnya KICc adalah 


Dengan : 


KICc = n(/n|£| + q) + 


d(3n — p — q — 1) 
n — p — q — 1 


d = qp + 0,5q(q+l) 


q = jumlah variabel respon 


n = jumlah data 

£ = penaksir matriks varian-kovarian error 

Kriteria pemilihan model terbaik jika didapatkan nilai KICc 
terkecil yang berarti semakin kecil nilai dari KICc maka semakin baik 
model yang digunakan. 


> Hubungan Antara Variabel Respon dan variabel Prediktor 

Pada regresi linear multivariate, ukuran yang digunakan untuk 
mengukur hubungan antara variabel respond an predictor adalah 
Wilk’s lambda. Ukuran dinyatakan dengan rumus sbb (Rencher, 2002) : 

77 ^ = 1 - A dengan A adalah nilai Wilk’s lambda 
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Nilai r\\ berada pada interval 0 dan 1. Artinya, semakin mendekati 1 
berarti hubungan antara variabel respon dan variabel predictor 
semakin erat. Karena r\\ melibatkan nilai dari Wilk’s lambda yang mana 
nilai Wilk’s lambda memperhitungkan antar variabel respon, hal tersebut 
dapat ditunjukkan dalam rumus A terdapat Y’Y. 

> Uji Hipotesis untuk Model Regresi 

Pengujian ini dilakukan untuk menguji apakah model regresi 
tidak sama dengan nol. Hipotesis yang digunakan adalah (Rencher, 
2001 ) : 

Ho :(3f0 dimana [3i’ = ((3i, (32, ... ,(3 q ) 

Hi : (3i ^ 0. 

Statistic uji: 


SSR /q 

F =-—-, 

S5E/(rt — q — l) 

Dimana, SSR = (p'X y - ny 2 ) dan SSE = (y'y - /?Ty) 


Tolak Ho jika Fhitung > Fa,q,n-q-l. 


> Uji Hipotesis untuk Koefisien (3 

Pengujian ini dilakukan untuk menguji apakah secara 
keseluruhan parameter tidak sama dengan nol. Hipotesis yang 
digunakan adalah sbb (Rencher, 2002) : 

tfo — P11 — P12 — *" — Ppl — "* — Ppq — 0 
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H ± : paling sedikit ada satu /3 pq =f= 0 


Dengan B=^° ^ = 

/ /?oi 

f hi 

/?02 ■■■ 

@21 ■■■ 

Po l\ 


Wi 

Pp2 ... 

Ppq/ 


Statistik uji yang digunakan adalah Wilk’s lambda 
A = -L-L- = V--=r dimana y adalah vector rata-rata dari matriks Y 

\E+H\ \Y Y-nyy \ J 

Ho ditolak jika Ahitung < Aa,q, P ,n- P -i adalah nilai table kritis untuk Wilk’s 
Lambda. 

> Uji Asumsi IIDN 

Asumsi yang harus dipenuhi dalam melakukan pemodelan 
regresi multivariate adalah residual memiliki matriks varian-kovarian 
yang homogen. Untuk menguji syarat ini dapat dipergunakan statistic uji 
Box’s M (Rencher, 2002) sbb : 

Hipotesis: 

Ho : Zi=Z2=--=Zi=Z 

Hi : minimal ada satu untuk i i- j 

Statistik uji: 

Ho :Ii=l 2 =...=Ik=I 

Hi : minimal ada satu untuk k ^ I 

Statistic uji: 

u = —2(1 — C x ) ln M 

Dimana : 
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Spool ~ 


Dengan c ± = 


TiT= i v k s k 
Ef=i v k 

1 = 1 

’fc 1 1 

1 r 2p 2 +3p—i j 

‘ l=1 Vl SjUv, 

J l.6(p+l)(k—1)J 


v t = n z - 1 


^ I ln|5p 00 ^ | 
J =1 / 


Asumsi residual independen, digunakan uji Barlett Sphercity. Variabel 
£i,£ 2 ,...,e q dikatakan bersifat saling bebas (independen) jika matriks 
korelasi antar residual membentuk matriks identitas. Untuk menguji 
kebebasan antar residual dapat dilakukan uji Barlett Spericity sbb 
(Morrison, 2005) : 


Hipotesis: 


Ho : residual bersifat independen 


Hi : residual bersifat dependen 


Statistic uji: 


^hitung {„ — i _!£±i) , n| S | 

Gagal tolak Ho jika xlitung ^ X? q ^ q _ 1 )Y an 9 berarti antar residual bersifat 
independen 

Asumsi yang harus dipenuhi dalam pemodelan regresi linier 
multivariate adalah residual yang memiliki distribusi multivariate normal. 
Pemeriksaan distribusi multivariate normal dapat dilakukan dengan cara 
membuat q-q plot dari nilai df (Johnson & Winchern, 2007). 

Hipotesis yang digunakan adalah sbb : 
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Ho : residual berdistribusi normal multivariate 
Hi : residual tidak berdistribusi normal multivariate 
df = (§i — e)' s i = 1,2, ...,n 

Kesimpulan adalah gagal tolak Ho atau data dikatakan berdistribusi 
normal multivariate jika ada sejumlah data yang memiliki nilai df <Xq,o ,5 
lebih dari 50%. 


> Korelasi Deterministik terkoreksi (R 2 ) 


Proporsi total variasi dalam y dapat dibentuk ke dalam regresi 
pada x yang dinotasikan dengan R 2 sebagai berikut: 


R 2 


jumlah kuadrat regresi 
jumlah kuadrat total 


j3'X'y - ny 2 

y'y — n y 2 


Dimana R 2 disebut dengan koefisien determinasi ganda atau lebih 
umumnya adalah korelasi berganda. Korelasi berganda R didefinisikan 
sebagai akar kuadrat postif R 2 . 

Uji F untuk model regresi dibentuk dari R 2 sebagai: 

tr _n-q-l R 1 

q 'l -R 2 ' 
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> Seleksi Variabel 


Dalam beberapa kasus regresi, banyak ditemukan model yang 
tidak memasukkan semua variabel yang terlibat di dalamnya. Hal ini 
diakibatkan oleh adanya validasi model yang nantinya apabila variabel 
dimasukkan dalam model akan berakibat menurunkan variansi /? ; dan 
y L . Ada beberapa cara untuk menyeleksi variabel-variabel tersebut, 
yaitu dengan memeriksa semua variabel yang mungkin dan dengan 
menggunakan teknik stepwise. 

Pemeriksaan Semua Variabel 

Pemeriksaan ini digunakan untuk mencari variabel yang sesuai dalam 
model. Dalam beberapa literature menyebutkan jumlah variabel 
dalam suatu model dinotasikan dengan p-1, sehingga dengan 
mencantumkan intercept, ada beberapa p parameter didalam model. 
Sesuai dengan jumlah total variabel yang tersedia dari model yang 
diseleksi dinotasikan dengan k-1, dengan k parameter dalam model. 
Ada beberapa cara dalam pemeriksaan ini, yaitu : 

1 . Rl 

Rl didefinisikan sebagai proporsi total jumlah kuadrat regresi, R 2 
mengukur dengan jelas suatu model, p subskrip adalah suatu 
indeks ukuran subset, dengan menggambarkan jumlah 
parameter dalam model, termasuk intercept. Bagaimanapun 
juga. R* tidak dapat mencapai maksimum untuk beberapa nilai 
dari p < k karena hal tersebut tidak dapat menurunkan ketika 
variabel ditambah dalam model. 

2. S 2 . 

Beberapa criteria lain yang berguna adalah penduga variansi 
untuk setiap subset yang didefinisikan sbb : 
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s 


2 

P 


SSE p 
n — p 


Untuk p = 2, 3,..., k. Jika k terlalu besar, tipe pola p yang di 
dekati oleh k adalah untuk meminimumkan untuk 
pengurangan secara keseluruhan minimum kurang dari Sl dan 
kemudian meningkatkannya. Nilai minimum dapat kurang 
dari Sl jika pengurangan SSE P dengan penambahan variabel 
yang tidak diimbangi dengan pengurangan derajat bebas. 
Alternative yang diberikan adalah memilih p seperti 
meminimumkan p S% = Sl atau memilih nilai yang paling kecil 
dari p seperti min p < Sl , ketika tidak aka nada p< k seperti 
min p Sl persis sama dengan 5|. 

3. Cp 

Statistic C P pertama kali dikemukan oleh C.L.Mallows dengan 
menggunakan rumus sbb : 


C 


P 



- (n - 2p). 


Dalam hal ini, SSE adalah jumlah kuadrat sisa dari model yang 
mengandung p parameter, p adalah banyaknya parameter 
dalam model termasuk (3o dan Sl adalah kuadrat tengah sisaan 
dari persamaan terbesar yang dipostulatkan mengandung 
semua Z, dan diasumsikan merupakan nilai dugaan takbias 
yang terandalkan bagi galat a 2 . Model terbaik ditentukan 
setelah memeriksa tebaran C P . Yang dicari adalah persamaan 
regresi dengan nilai C P rendah yang kira-kira sama dengan p. 
Bila mana yang dipilih tidak jelas, maka merupakan penilaian 
yang bersifat pribadi untuk memilih : 

1. Persamaan berbias yang tidak diwakili data apapun karena 
JKS P nya lebih besar (sehingga C P > p) namun memiliki C P 
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yang lebih kecil yang merupakan nilai dugaan bagi 
simpangan total (galat ragam plus galat bias) dari model 
sebenarnya tidak diketahui, atau 

2. Persamaan dengan parameter lebih banyak sehingga 
mempunyai ketepatan lebih baik terhadap data (artinya 
C P ~ p) namun mempunyai simpangan total (galat ragam 
plus galat bias) yang lebih besar dari model sebenarnya 
yang tidak diketahui. Dengan kata lain, model yang lebih 
kecil cenderung mempunyai nilai C P yang lebih kecil pula, 
namun model yang lebih besar (dengan p yang lebih 
besar) cenderung mempunyai C P yang lebih dekat dengan 
p. 

> Stepwise Regresi 

Metode eliminasi langkah mundur mulai dengan regresi 
terbesar dengan menggunakan semua peubah, dan secara bertahap 
mengurangi banyaknya peubah di dalam persamaan sampai suatu 
keputusan dicapai untuk menggunakan persamaan yang diperoleh. 
Prosedur stepwise ini mencapai kesimpulan yang serupa namun dengan 
menempuh arah yang berlawanan, yaitu menyusupkan peubah satu 
demi satu sampai diperoleh persamaan regresi yang memuaskan. 
Urutan penyisipannya ditentukan dengan menggunakan koefisien 
korelasi parsial sebagai ukuran pentingnya peubah yang masih di luar 
persamaan. Prosedur dalam penyeleksian menggunakan stepwise ini 
hamper sama dengan melihat variabel yang terbaik dimasukkan dalam 
setiap langkah. Kemudian setelah variabel telah dimasukkan, setiap 
variabel yang baru dimasukkan dengan memeriksa secara individu 
dengan menggunakan uji F untuk melihat jika variabel tersebut tidak 
signifikan dan dikeluarkan dari model. 

Ada beberapa kemungkinan resiko dalam menggunakan 
metode stepwise. Dalam prosedur stepwise bisa jadi gagal mendeteksi 
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variabel predictor yang benar karena S* adalah bias yang tinggi 
dibawah spesifikasi model, sehingga mengurangi nilai F pada masing- 
masing variabel yang dibuat. Di sisi lain, sebuah variabel yang bukan 
variabel predictor y yang benar dapat memasukkan karena adanya 
korelasi yang ada dalam sampel tertentu. Dalam beberapa 
kesempatan, seperti variabel yang kuat, statistic uji F untuk memasukkan 
variabel yang tidak mempunyai suatu distribusi F karena 
dimaksimumkan pada setiap langkah. 

Langkah-langkah dalam analisis regresi multivariate yaitu sbb : 

1. Melakukan pengujian korelasi antar variabel respon dengan 
menggunakan uji Barlett test. Jika terbukti variabel respon 
berkorelasi maka analisis dapat dilanjutkan pada tahap 
selanjutnya dengan metode multivariate, jika tidak maka 
metode yang digunakan adalah metode univariat. 

2. Melakukan pemilihan model dengan menggunakan metode 
KICc berdasarkan factor-faktor yang mempengaruhi. 

3. Melakukan pengujian estimasi parameter model regresi 
multivariate 

4. Melakukan pengujian signifikansi parameter model regresi 
multivariate 

5. Melakukan pengujian asumsi residual IIDN (identik, independen, 
dan distribusi normal) 

6. Mendapatkan factor-faktor yang berpengaruh dan kesimpulan. 

Dengan demikian, karena adanya korelasi pada regresi multivariate 
maka akan di cari berapa besar korelasi diantara variabel dependen. 
Sehingga untuk mengetahui besar korelasi antar variabel dependen 
maka dapat dilanjutkan kembali dengan menggunakan analisis jalur 
(path analysis). 
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14.4. Analisis Jalur (Path Analysis) 


Analisis jalur merupakan pengembangan lebih lanjut dari analisis regresi 
berganda ataupun multivariate. Analisis jalur ingin menguji persamaan 
regresi yang melibatkan beberapa variabel eksogen dan endogen 
sekaligus sehingga memungkinkan pengujian terhadap variabel 
mediating/intervening atau variabel antara. Disamping itu, analisis jalur 
juga dapat mengukur hubungan langsung antar variabel dalam model 
maupun hubungan tidak langsung antar variabel dalam model. Analisis 
jalur yang merupakan pengembangan dari model regresi yang 
digunakan untuk menguji kesesuaian (fit) dari matrik korelasi dari dua 
atau lebih model yang dibandingkan oleh si peneliti. Model biasanya 
digambarkan dengan lingkaran dan anak panah yang menunjukkan 
hubungan kausalitas. Regresi dilakukan untuk setiap variabel dalam 
model. Nilai regresi yang diprediksi oleh model dibandingkan dengan 
matrik korelasi hasil observasi variabel dan nilai goodness of fit dihitung. 
Model terbaik dipilih berdasarkan nilai goodness of fit. Menurut Imam 
Ghozali, terdapat dua asumsi yang melandasi diagram jalur, yaitu : 

1. Semua hubungan kausalitas didasarkan pada teori. Teori 
sebagai dasar memasukkan atau menghilangkan hubungan 
kausalitas. 

2. Hubungan kausalitas dalam model dianggap linier. 
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Contoh model analisis jalur: 



Dengan notasi-notasi yang digunakan sebagai berikut: 


• y (gamma) : koefisien pengukur hubungan antara variabel 
endogen dengan eksogen 

• (3 (beta) : koefisien yang mengukur hubungan antar variabel 
dependen (endogen). 

• (phi) : koefisien yang mengukur hubungan antar variabel 
independen (eksogen). 

• £ (zeta) : varian peubah latent yg tdk terjelaskan model 

• Y : variabel dependen (endogen) 

• X : variabel independen (eksogen) 
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14.5. Ilustrasi Analisis Jalur (Path Analysis) 


Misalkan kita ingin melakukan penelitian mengenai model hubungan 
antara gaji yang diterima oleh pekerja di suatu perusahaan dengan 
latar belakang pendidikan formal yang dimiliki, masa kerja, gaji awal 
bekerja, serta masa kerja sebelumnya, serta model hubungan antara 
gaji awal bekerja dengan latar belakang pendidikan formal serta masa 
kerja sebelumnya. Diambil 474 data dari pekerja yang ada, dimana: 

XI = pendidikan dalam tahun pendidikan formal 

X2 = masa kerja pada pekerjaan (perusahaan) sekarang dalam bulan 

X3 = masa kerja sebelum pekerjaan (perusahaan) sekarang dalam 
bulan 

Y1 = Gaji sekarang (dalam Juta Rp) 

Y2 = Gaji awal bekerja (dalam Juta Rp) 
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Misalnya kita membentuk model sebagai berikut: 

Y1 = XI X2 X3 Y2 
Y2 = XI X3 

Yang berarti bahwa gaji sekarang (Yl) selain dipengaruhi oleh pendidikan 
(XI), masa kerja sekarang (X2), masa kerja sebelumnya (X3), juga 
dipengaruhi oleh gaji awal bekerja (Y2). Gaji awal bekerja (Y2) itu sendiri 
juga dipengaruhi oleh pendidikan (XI) dan masa kerja sebelumnya (X3). 

Input untuk menjalankan persamaan tersebut adalah sebagai 

berikut: 

Analis ?arh Dengan Menggunakan LISREL 

Rav Dara frosn file 9 D: \blog\ker jai.psf 9 

Relationships 

Yl = CONSTAN XI X2 X3 Y2 

Y2 = CON3TAKT XI X3 

rarh Diagram 

Opraons: 33 EF 

End of Problem 


Catatan: perintah Option: SS, digunakan untuk menampilkan nilai 
standardized hubungan antar variable. Jika perintah ini tidak digunakan, 
maka yang akan ditampilkan hanya nilai unstandarized (tetapi nilai 
standardized tetap bias dilihat pada path diagram). Option: EF digunakan 
untuk menampilkan effect decomposition (komposisi pengaruh). 


Dengan input tersebut, LISREL menghasilkan estimasi regresi unstandarized 
berikut: 


n - 

- 1.11 

♦ 1.77*0 

♦ 3.347*X1 • 0.014*12 - 

O.OOr*». brCnU 

- :.5S . 9« -3.01 


(Q.!)) 


(0.014) (0.9324) 

(0.00329) 

(0.024) 


•4.12 

K.22 

4.01 4.72 

-4.91 

19.22 

T2 • 

- 0.99 

♦ 0.1»*» 

♦ 0.Q01f*X2, tnMt.- 

0.24 # 1* - 0.43 



(0.14) 

(9.0097) 

(0.90027) 

(0.322) 



-€.!• 

19.43 

4.17 

11.22 
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Dari output tersebut terlihat bahwa semua variabel pada taraf 1 % 
berpengaruh signifikan, baik terhadap Y1 maupun Y2. 


Selanjutnya, output covariance matrix untuk independent variables dan 
latent variables diberikan sebagai berikut. Interpretasinya sama dengan 
kasus sebelumnya. 


Ccvariir.ee 

Xacnx of 

lr.depeadent Variables 



XI 

X2 

X3 


XI 

e.32 

(0.54) 





15.33 




X2 

1.36 

101.22 




(1.34) 

(€.€0> 




1.03 

15.33 



X3 

•74.14 

3.13 

10936.26 



(14.35) 

(48.54) 

(713.53) 



-5.30 

0.0€ 

15.33 


Co?AxiAr.ce 

katnx of 

Later.t Variables 



Y1 

Y2 

XI X2 

X3 

Y1 

2.94 




Y2 

1.19 

0. €2 



XI 

3.25 

1.44 

6.32 


X2 

2.19 

0.26 

1.36 101.22 


X2 

-17.41 

3.72 

-74.14 3.13 

10938.28 

Selanjutnya sebagian output uocir.es s 

of rit Jtttmui dibenkan dibawa h tni 



Socd&tas of 

fit 3 tatisties 




Degree» of freedoea * 1 



HinuBUB fit Funcricn Chi a> Sqaare * 2.41 

(P ■ 0.12) 


Model memiliki fit yang sangat baik karena memiliki nilai probabilitas yang 
tidak signifikan (p-value = 0,12 Chi-Square = 2,41 dengan df = 1). Catatan: 
model yang fit seharusnya memiliki nilai p yang tidak signifikan (lebih besar 
dari 0,05). 
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Berdasarkan perintah Option: SS, LISREL memberikan output sebagai 
berikut: 



Output BETA adalah output LISREL yang berupa matriks hubungan antara 
sesame variable endogen. Bagian kolom adalah variable endogen 
independent dan bagian baris adalah variable endogen dependent. Dari 
output tersebut diketahui nilai standardized pengaruh antara Y2 terhadap 
Y1 adalah 0,81. 


Output GAMMA adalah output LISREL yang berupa matriks pengaruh 
(standardized) antara variable eksogen (independent) terhadap variable 
endogen (dependen). Bagian kolom adalah variable eksogen 
(independent) dan bagian baris adalah variable endogen (dependent). 
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yaitu output BETA dan GAMMA. 


Selanjutnya, berdasarkan perintah Option: EF, LISREL memberikan output 
berikut: 


Total Effocts 

of X on Y 


XI 

X2 

X3 

Y1 0.40 

0.02 

0.00 

(0.02) 

(0.00) 

(0.00) 

10.92 

4.73 

2.02 

Y2 0.19 

- - 

0.00 

(0.01) 


(0.00) 

19.40 


€.17 


Output diatas memberikan pengaruh total antara variable eksogen 
terhadap variable endogen. Pengaruh total ini merupakan penjumlahan 
dari pengaruh langsung (lihat output estimasi regresi unstandarized 
sebelumnya) dengan pengaruh tidak langsung (lihat output di bawah ini). 
Misalnya pengaruh total XI terhadap Y1 sebesar 0,40. Ini adalah 
penjumlahan dari pengaruh langsung XI terhadap Y1 sebesar 0,067 
dengan pengaruh tidak langsung XI terhadap Y1 sebesar 0,33. 


Pengaruh total X2 terhadap Y1 sama dengan pengaruh langsungnya. 
Karena hubungan X2 dan Y1 adalah langsung dan tidak memiliki 
hubungan tidak langsung. 


Indircct Effects of X on 

Y 

X 

M 

X 

M 

X2 

Y1 0.33 

0.00 

(0.02) 

(0.00) 

1€.32 

€.04 

Y2 






Output diatas memberikan pengaruh tidak langsung antara variable. 
Misalnya pengaruh tidak langsung XI terhadap Y1 adalah sebesar 0,33. Ini 
diperoleh melalui perkalian antara pengaruh langsung antara XI 
terhadap Y2 (variable antara) dengan pengaruh langsung Y2 terhadap 
Yl. Dengan demikian nilai 0,33 diperoleh melalui 0,19 x 1,77 = 0,33. (Untuk 
lebih mudah memahaminya, lihat path diagram di bawah). 


Total 

Effccts of Y on Y 


Yl Y2 

Yl 

1.77 


(0.06) 


30.22 

Y2 

- - 


Output diatas memberikan pengaruh total variable endogen terhadap 
variable endogen. Pengaruh total Y2 terhadap Yl sama dengan 
pengaruh langsungnya. Karena hubungan antara Y2 dan Yl adalah 
langsung dan tidak memiliki hubungan tidak langsung. 
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Tampilan output diatas sama dengan tampilan sebelumnya, hanya ini 
merupakan pengaruh yang telah standarized (yang diturunkan dari 
estimasi nilai standarized). 
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15.Model Persamaan Struktural (Structural Equation 
Models ) 


15.1. Pendahuluan 

Penelitian pada bidang ilmu social umumnya menggunakan konsep- 
konsep teoritis atau konstruk-konstruk yang tidak dapat diukur atau dapat 
diamati secara langsung. Namun kita masih bisa menemukan beberapa 
indicator untuk mempelajari konsep-konsep teoritis tersebut. Kondisi 
seperti di atas menimbulkan dua permasalahan besar untuk membuat 
kesimpulan ilmiah dalam ilmu social dan perilaku,yaitu : 

1. Masalah pengukuran 

2. Masalah hubungan kausal antar variable 

Structural Equation Modelling (SEM) merupakan salah satu analisis statistik 
yang dapat menjawab permasalahan di atas. SEM dikembangkan oleh 
Kari Joreskorg, Keesling dan Willey. SEM merupakan salah satu tehnik 
pengolahan data statistik multivariate structural relationship. Pemodelan 
penelitian melalui SEM memungkinkan seorang peneliti dapat menjawab 
pertanyaan yang regresif maupun dimensional (yaitu mengukur apa 
dimensi-dimensi sebuah konsep). Pada saat seorang peneliti menghadapi 
pertanyaan penelitian berupa identifikasi dimensi-dimensi sebuah konsep 
atau konstruk seperti yang lazim dilakukan pada analisis faktor) dan pada 
saat yang sama peneliti ingin mengukur pengaruh atau derajat atau 
hubungan antar faktor yang telah diidentifikasikan dimensi-dimensinya itu. 
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SEM merupakan alternative jawaban yang layak untuk diajukan. Oleh 
karena itu, dapat dikatakan bahwa pada dasarnnya SEM adalah 
kombinasi antara analisis faktor dan analisis regresi berganda. 

Terdapat beberapa tujuan dari SEM, antara lain: 

1. Mendapatkan model struktural yang dapat digunakan untuk 
keperluan prediksi. Dalam hal ini, SEM setara dengan REGRESI. 

2. Menguji pengaruh (langsung dan tidak langsung) variabel bebas 
terhadap variabel tidak-bebas, menentukan variabel dominan, dan 
jalur-jalur keterkaitan antar variabel. Dalam hal ini, SEM setara dengan 
analisis jalur. 

15.2. Konsep Dasar SEM 

SEM adalah sekumpulan alat-alat atau teknik statistika yang 
memungkinkan tidak hanya mendapatkan model hubungan namun juga 
pengujian sebuah rangkaian hubungan yang relative rumit secara 
simultan. 

Hubungan rumit itu dapat dibangun antara satu atau beberapa variabel 
dependen dengan satu arah atau beberapa variabel independen. 
Masing-masing variabel dependen dan independen dapat berbentuk 
faktor (konstruk yang dibangun dari beberapa variabel indicator). 
Variabel-variabel itu dapat berbentuk sebuah variabel tunggal yang 
diobservasi atau yang diukur langsung dalam sebuah penelitian. 

Teknik analisis data dalam SEM dilakukan untuk menjelaskan secara 
menyeluruh hubungan antar variabel yang ada dalam penelitian. SEM 
digunakan bukan untuk merancang suatu teori, tetapi lebih ditujukan 
untuk memeriksa dan membenarkan suatu model. Oleh karena itu, syarat 
utama menggunakan SEM adalah membangun suatu model hipotesis 
yang terdiri dari model struktural dan model pengukuran dalam bentuk 
diagram jalur yang berdasarkan justifikasi teori. 
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15.2.1. Komponen- komponen model SEM 

Komponen-komponen dari model SEM dapat dibedakan menjadi: 

1. 2 jenis variabel laten dan variabel teramati (observed atau measured 

atau manifest variabel). 

Variabel laten merupakan konsep abstrak sebagai contoh : perilaku 
orang, sikap, perasaan dan motivasi. Variabel laten ini hanya dapat 
diamati secara tidak langsung dan tidak sempurna melalui efeknya 
pada variable teramati. SEM mempunyai 2 jenis variable laten, yaitu 


Variabel Eksogen sebagai variabel bebas dan dinotasikan 
dengan Ksi (£). 

Variabel Endogen merupakan variabel terikat pada model dan 
dinotasikan dengan Eta (n). 

Variabel laten ini digambarkan dalam bentuk diagram lingkar 


atau oval atau ellips, 

Variabel teramati adalah variable yang dapat diamati atau 
dapat diukur secara empiris dan sering disebut sebagai 
indicator. Variabel terukur adalah variabel yang datanya 
harus di cari melalui penelitian lapangan dan digambarkan 
dalam bentuk diagram bujur sangkar seperti 


2. 2 jenis model yaitu model struktural (model yang menjelaskan prediksi 

atau hipotesis hubungan antara variable penyebab terhadap 
variable akibat) 
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Gambar 1. model struktural 


Keterangan : 

ETA1 = GAMMA11 x Ksi 1 + GAMMA12 x Ksi 12 
ETA2 = BETA 21 x Eta 1 

ETA3 = BETA 31 x Eta 1 + GAMMA 32 x Ksi 12 
atau 

rii = y 11 ^ 1 + y 12 ( 2 

V2 = 

V3 = £>31*11 + 732^2 

dan model pengukuran (model yang menjelaskan 
operasionalisasi variable penelitian menjadi indikator-indikator 
terukur yang dinyatakan dalam bentuk diagram jalur dan atau 
persamaan matematik tertentu). Model pengukuran 
(/Vleasuremenf Model ) adalah proses pemodelan untuk 
menyelidiki unidimensionalitas dari indicator-indikator yang 
menjelaskan sebuah faktor. Pengukuran ini bertujuan untuk 
mengkorfimasi faktor-faktor yang telah terbentuk, sehingga 
analisis ini disebut Confirmocy Faktor Analysis. Keakuratan model 
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pengukuran adalah dengan pemeriksaan mengenai validitas dan 
reliabilitas. Hasil yang signifikan dari A menunjukkan data valid, 
dan S maupun e yang tidak signifikan menunjukkan hasil yang 
reliable. 



Gambar 2. Model Pengukuran 


Keterangan : 

XI = Lambda XII x Ksi 1 
X2 = Lambda X21 x Ksi 1 
X3 = Lambda X31 x Ksi 1 
atau 

%i — A. x a <fi 
%2 = ^x21 
%3 = AX31 Ki 

3. 2 jenis kesalahan yaitu kesalahan struktural dan kesalahan 

pengukuran. 

Kesalahan struktural muncul disebabkan variabel bebas tidak dapat 
memprediksi secara sempurna variabel terikat. Kaesalahan ini 
diasumsikan tidak berkorelasi dengan variable eksogen dari model 
dan dinotasikan dengan £ (“zeta”). 
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Kesalahan pengukuran disebabkan oleh indikator-indikator atau 
variabel-variabel teramati tidak dapat secara sempurna mengukur 
variabel laten terkait. Komponen kesalahan yang berkaitan dengan 
variabel teramati X dinotasikan dengan 8 (“delta”), sedangkan yang 
berkaitan dengan variabel y dinotasikan dengan s (“epsilon”) 

Mengapa SEM dilakukan? 

1. Melibatkan variabel laten 

2. Evaluasi kualitas pengukuran 

3. Memperhitungkan error of measurement dalam manifest 
variabel (eksogeneous dan endogeneous) 

4. Menghasilkan direct indirect dan total effect dari variabel- 
variabel dalam model 


Hubungan antar variabel dinyatakan melalui garis, karena itu bila 
tidak ada garis berarti tidak ada hubungan langsung yang di 
hipotesakan. 

Bentuk-bentuk hubungan antar variabel dalah sebagai berikut: 

1. Garis dengan anak panah satu arah (-► ) 

Garis ini menujukkan adanya hubungan yang dihipotesakan 
antara dua variabel dimana variabel yang dituju oleh anak 
panah merupakan variabel dependent. dalam SEM terdapat 2 
hipotesis dengan anaka panah satu arah, yaitu : 
a. Hipotesa mengenai dimensi faktor 

Dimensi-dimensi sebuah faktor akan terlihat dalam diagram 
SEM melalui arah anak panah ( —► ) yang digunakan. 
Masing-masing indicator sebagai variabel dependen secara 
bersama-sama dihipotesakan sebagai dimensi dari sebuah 
konsep atau faktor. 
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b. Hipotesa mengenai hubungan regresi 

Hipotesa mengenai pengaruh satu atau beberapa varibel 
independen terhadap satu atau beberapa variabel 
dependen dinyatakan pula dalam anak panah satu arah 

2. Garis dengan anak panah dua arah (◄-►) 

Anak panah dua arah ini digunakan untuk menggambarkan 
kovarian atau korelasi antara dua variabel 





r -- 

Struktur Model 


Struktur Model 


Model Faktor Fariable 

(Variable eksogen) 


(Variable laten) 


k_- 


Gambar 3. model Diagram lintasan 

Gambar di atas menunjukkan bahwa model persamaan structural 
merupakan pendekatan terintegrasi antara analisis faktor konfirmatori, 
model struktural dan analisis jalur. 

15.2.2. Notasi SEM 

Notasi-notasi yang dipakai dalam SEM : 

X - indicator variabel eksogen 
Y = indicator varibel endogen 
^ = Ksi, variabel laten X atau variabel laten eksogen 

H = Eta, variabel laten Y atau variabel laten endogen 
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8 = Delta, galat pengukuran pada variabel manifest untuk variabel laten 

X 

£ = Epsilon, Galat pengukuran pada variabel manifest untuk variabel 

laten Y 

Y = Gamma, koofisien pengaruh variabel eksogen terhadap variabel 
endogen 

(3 = Beta, koofisien pengaruh variabel endogen terhadap variabel 

eksogen 

A = Lambda, loading faktor 

Dalam SEM dapat dilakukan analisis hubungan antar peubah laten 

dengan peubah indicator dengan metode analisis Faktor Konfirmatori, 

sekaligus mendapatkan model yang bermanfaat untuk prediksi atau 

prakiraan, dilakukan dengan model struktural. 

Terdapat beberapa model yang dianalisis dalam SEM yaitu : 

1. Model Analisis Faktor 

Model ini menganalisis faktor-faktor yang mempengaruhi atau menjadi 
indicator bagi variable laten maupun terikat, model pengukuran yang 
digunakan dalam Model pengukuran yang digunakan dalam hal ini 
disebut sebagai CFA model (Confirmotory Factor Anoysis Model). 
Model pengukuran ini sedikit berbeda dengan model pengukuran 
sebelumnya, yaitu EFA model (Exploratory Factor Analysis ). 

Pada EFA, model rinci yang menunjukkan hubungan antara variabel 
laten dengan variabel teramati tidak dispesifikasikan dan ditentukan 
terlebih dahulu (sebelum analisis dilakukan), semua variabel laten 
diasumsikan mempengaruhi semua variabel teramati dengan error 
yang tidak boleh berkorelasi. Sedangkan pada CFA model, jumlah 
variabel dan pengaruh suatu variabel laten terhadap variabel 
teramati ditentukan terlebih dahulu, kesalahan pengukuran bisa 
berkorelasi dan dibutuhkan identifikasi parameter. Selain itu beberapa 


357 



efek langsung variabel laten terhadap variabel teramati dapat 
ditetapkan sama dengan nol atau suatu konstanta, begitu pula 
dengan kovarian variabel-variabel laten dapat diestimasi (ditetapkan) 
pada nilai tertentu. 

Dari EFA bisa ditemukan struktur data tertentu. Sementara dari CFA 
dapat dinilai kecocokan data dengan model untuk menentukan 
penerimaan atau penolakan suatu teori. 

2. Model Analisis Regresi, model ini akan menganalisis antara variabel 
laten X sebagai variabel laten bebas terhadap variabel laten Y 
(variabel laten terikat) untuk mendapatkan model struktural yang 
dapat digunakan saat prediksi. 

3. Model Analisis Jalur (Path Analysis ), model ini akan merepresentasikan 
sistem persamaan simultan melalui diagram jalur, penguraian ragam 
dan korelasi dalam model parameter dan pemisahan antara 
pengaruh langsung, pengaruh tidak langsung serta pengaruh total dari 
suatu variabel terhadap variabel lain. 


15.2.3. Metode Perhitungan 

Model persamaan SEM sangat komplek sehingga tidak dihitung 
secara manual. Model ini menggunakan input data korelasi dan 
kovarian yang dirumuskan dengan: 

Kovarian untuk data populasi. 


E(*-fe ) 2 


N, 


pop 


1(Y-Hy) 


J xy ' 


N, 


pop 


dan untuk data sample, 


2 _ 

X 


ixx-xy 

n — 1 


\ — 
^xy 


I(X-X) (r-r) 
n — 1 
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2 SG '-?) 2 

y n — 1 

Sedangkan rumus korelasi untuk data populasi adalah, 
P yx = Y = a + ( 3 yx X + s 

r =^= n — 

Pxy a 2 Pyx 

dan korelasi data sample, 

r yx = ~~ Y = a + P yx X + £ 


Input data korelasi dan kovarians yang akan digunakan bisa ditulis 
dalam bentuk matriks menjadi. 



\ 1 

P 12 

-► 

a? a 12 

<*13 

p = 

P 21 

1 

dikali a^aj v 
dibagi a^aj " 

1 2 

&21 °2 

°23 


P 31 

P 32 

031 a 32 

°3 J 


dan untuk data sample menjadi, 


1 

r-i2 

7*13 

-► 

S 1 

S 12 

5 13 

r 2 i 

1 

r 23 

dikali a^aj v 
dibagi a^aj ^ 

S 21 

0 2 
S 2 

5 23 

- r 31 

r 32 

1 . 

< --- 

_ 5 31 

S 32 

S 3 J 


Demikian juga dengan model pengukuran bisa kita tuliskan dalam 
bentuk matrik sebagai berikut: 


r*ii 


'Xk 1± 0 " 



lAl 


= 

Ax 2 i 0 


y 

+ 

$2 

A- 


- 0 Ax 62- 



A- 


rAi 

y* 


Ayu 0 
Ay 2 i 0 

riil 


£r 

£2 

-Ye- 


- 0 Ay 62 - 

n 2 . 

+ 



atau menjadi, 
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X = A x ^ + 6 


dan Y = A y n + £ 


dengan Aiadalah matrik model pengukuran. 
Dan untuk matrik model struktural menjadi, 


[Hil 


0 °1N + 

[Yn Y 12 l 

[^1 

i 

[q 

ln 2 J 


[p 21 oj In J + 

[y 21 y 22 J 

k J 


[y 


atau n = B r) + l"5 + £ 


15.2.4. Asumsi-asumsi SEM: 

a. Ukuran sampel. 

Ukuran sampel yang harus dipenuhi dalam pemodelan ini adalah 
minimum berjumlah 100 dan selanjutnya menggunakan 
perbandingan lima observasi untuk setiap estimated parameter. 
Penentuan besarnya sampel: 

1. Kalau pendugaan dg metode Maximum likelihood,maka 
sampel 100-200, minimum absolut 50 

2. Jumlah sampel = 5-10 kali banyaknya parameter 

3. Jumlah sampel = 5-10 kali jumlah variabel manifest dari 
keseluruhan variabel laten. 

b. Normalitas dan Linearitas 

Normalitas dapat diuji dengan melihat gambar histogram atau 
dengan metode-metode statistik, uji linearitas dapat dilakukan 
dengan mengamati scatter plot dari data, yaitu dengan memilih 
pasangan data dan dilihat pola penyebarannya untuk menduga 
adanya linearitas. Sebaran data yang dianalisis harus memenuhi 
asumsi sebaran normal dan hubungan antar estimated 
parameter bersifat linear. 
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c. Outliers 

Outliers adalah observasi yang muncul dengan nilai-nilai ekstrim 
baik secara univariat maupun multivariate yaitu yang muncul 
karena kombinasi karakteristik unik yang dimilikinya dan terlihat 
sangat jauh berbeda dari observasi-observasi lainnya, dan ini bisa 
mengganggu pada saat analisis data. 

d. Multikolinearitas dan singularitas 

variabel yang saling berhubungan akan menyebabkan hasil yang 
bias sebaiknya data tidak ada multikolinearitas dan singularitas. 
Bila ada sebaiknya data dikeluarkan, atau alternative lain adalah 
data tersebut dibuat ‘composit variabels’, dan variabel komposit 
dapat di analisis lebih lanjut. Multikolinearitas dapat di deteksi dari 
determinan matriks kovarian. Nilai determinan matriks kovarian 
yang sangat kecil memberikan indikasi adanya problem 
multikolinearitas. 


15.2.5. Langkah-langkah SEM 

Sebuah pemodelan SEM yang lengkap pada dasarnya terdiri dari 
Measurement berdasarkan indicator-indikator empirisnya.Model dan 
Structural Model. Model pengukuran ditujukan untuk mengkorfimasi 
sebuah dimensi atau faktor berdasarkan indicator-indikator empirisnya. 
Struktural Model adalah model mengenai struktur hubungan yang 
membentuk atau menjelaskan kausalitas antar faktor. 

1. Pengembangan Model Konsep dan Teori 

Model Hipotetik = Model Konseptual = Model Teoritis 

Hubungan kausalitas sebab-akibat antara variabel eksogen (variabel 
bebas, independent) dan variabel endogen (variabel tergantung, 
variabel dependent). Dengan demikian landasan teorinya harus kuat 
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untuk dapat menjelaskan Model Hipotetik tersebut. Salah satu aspek 
kritis dalam hal ini adalah “Spesifikasi variabel”, terutama variabel 
prediktif. Untuk kepentingan praktis analisis data dan interpretasinya, 
maka seyogyanya banyaknya variabel tidak lebih dari 20. 

2. Konstruksi Diagram Lintasan 

Diagram ini sangat bermanfaat untuk menunjukkan alur-alur 
(lintasan) kausalita antar variabel yang secara teoritis layak 
Hubungan kausalita : Simbol panah satu arah 
Hubungan korelasional : Simbol panah bolak-balik 



Gambar 4. Diagram Lintasan 


3. Konversi Diagram Lintasan menjadi Model Struktural 


r|l = P2. r|2 + yl. ^1 + C,1 

r|2 = pi. r|l + yl. \1 + y3. £3 + Q 

X1.1 = A1.£1 +81 

X1.2 = 12. £1 + 82 .... Dst. 
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Gambar 5. Ilustrasi path model SEM 


4. Memiliki Matriks Input 

Input data untuk SEM dapat berupa: 

1. Matriks korelasi, atau 

2. Matriks peragam, kovarians 


Matriks korelasi, digunakan kalau: 

1. Tujuannya ingin membuktikan hubungan kausalitas antar variabel 

2. Lintasan mana saja yang pengaruhnya dominan 

3. Variabel eksogen mana saja yang pengaruhnya dominan 
terhadap 

variabel endogen 


Matriks Peragam, digunakan kalau: 

1. Tujuannya menguji model hipotetik yang secara teoritis sudah 
layak 

2. Serupa dengan analisis regresi 

3. Model yang diperoleh dapat digunakan untuk prediksi 

4. Model yg diperoleh dapat untuk menjelaskan fenomena yang 
dikaji 


5. Menilai Masalah Identifikasi 

Problematik pendugaan parameter: 

1. Un-identified atau under identified 

2. Over identified 

Gejala yg muncul akibat dari adanya “masalah identifikasi”: 

a. Adanya Standard error yang terlalu besar 

b. Matriks informasi tidak dapat disajikan sebagaimana mestinya 
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c. Nilai penduga parameter tidak dapat diperoleh 

d. Muncul angka (nilai) yang aneh 

e. Adanya koefisien korelasi yg tinggi (> 0.9) antar koefisien 
hasil pendugaan 


Cara mengatasinya: 

1. Landasan teori yang digunakan untuk menyusun Model 
Hipotetik harus benar-benar ‘bagus” 

2. Menambah atau mengurangi variabel laten, disesuaikan 
dengan landasan teorinya 

3. Iterasi dalam pendugaan model dengan menetapkan 
“kendala” pada model, misalnya salah satu atau beberapa 
parameter model dianggap “fixed” 

6. Evaluasi Goodness of fit 

Asumsi-asumsi SEM: 

1. Asumsi yang berkaitan dengan model 

2. Asumsi yang berkaitan dengan pendugaan parameter & 
pengujian hipotesis 


Asumsi yang berkaitan dengan model: 

1. Semua hubungan berbentuk linier (Lihat diagram pencarnya) 

2. Model bersifat aditif, sesuai dengan landasan teorinya 


Asumsi Pendugaan parameter & Uji hipotesis: 

1. Random sampling 

2. Tidak boleh ada missing data 

3. Tidak ada data pencilan, outliers 

4. Untuk pendugaan parameter, jumlah sampel minimum 100 


Tahapan Goodness of fit: 

1. Uji Parameter, dengan t-test: 

a. Parameter Lamda: validitas instrument 

b. Parameter Delta dan Epsilon: Reliabilitas instrumen 

c. Parameter Beta dan Gama, dan lainnya 

2. Uji Keseluruhan Model 

Model ini merupakan integrasi antara model struktural dan 
model pengukuran 

3. Uji Model Struktural 

Menggunakan uji koefisien determinasi, seperti model regresi 
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4. Uji Model Pengukuran 

Uji validitas.koefisien korelasi 

Uji reliabilitas. Nilai error 

7. Interpretasi dan Modifikasi Model 


Bilamana model yang diperoleh cukup baik, maka selanjutnya 
adalah melakukan interpretasi. Bila model belum baik maka perlu 
diadakan modifikasi. Modikasi model hanya dapat dilakukan bila 
ada justifikasi teoritis atau konsep yang cukup kuat sebab metode 
SEM bukan ditujukan untuk menghasilkan teori atau model, tetapi 
menguji model. Kelemahannya terutama adalah sangat sulitnya 
diperoleh diperoleh diperoleh model yang cocok dengan data 
(fitting model) karena kompleksnya hubungan. 

Interpretasi Model: 

1. Model Struktural: Interpretasi terhadap fenomena yg sedang 
dikaji, dan melakukan prediksi 

2. Analisis Lintasan: 

a. Efek langsung 

b. Efek tidak langsung 

c. Total efek 

d. Faktor dominan 

e. Kausalitas antar variabel. 


15.2.6. Uji Kesesuaian dan Uji Statistik 

Dalam analisi SEM tidak ada alat uji statistik tunggal untuk mengukur atau 
menguji hipotesis mengenai model. Evaluasi goodness of fit yang 
dimaksud adalah untuk mengukur kebenaran model yang di ajukan. 
Berikut ini dalah beberapa indek kesesuaian dan cut off value nya yang 
digunakan untuk menguji apakahsebuah model dapat diterima atau 
ditolak. 
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a. Chi-square Statistics 

alat uji paling fundamental untuk mengukur overall fit adalah 
Chi-Square. chi-square ini bersifat sangat sensitive terhadap 
besarnya sampel yang digunakan karena itu bilamana jumlah 
smapel yang digunakan cukup besar yaitu > 2000 sampel, chi- 
square harus didampingi oleh alat uji lain, maka sampel yang 
digunakan antara range 100-200 sampel. Semakin kecil nilai 
Chi-square maka semakin kecil kebenaran model tersebut. 

b. RMSEA(The Root Means Square Error of Approximation) 

RMSEA adalah sebuah indeks yang dapat digunakan untuk 
mengkompensasi chi-square statistics dalam sampel besar. 
Nilai RMSEA lebih kecil atau sama dengan 0.08 merupakan 
indeks untuk diterimanya model yang menunjukkan sebuah 
close fit dari sebuah model berdasarkan derajat bebas. 

c. GFI (Goodness-of fit lndex) 

Indeks kesesuaian ini akan menghitung proporsi tertimbang dari 
varian dari matriks kovarian sampel yang dijelaskan oleh matriks 
kovarian populasi yang tersetimasikan. GFI adalah ukuran non- 
statistical yang mempunyai rentang nilai antara 0(poor fit) 
sampai dengan 1 (perfect fit). Nilai yang tinggi dalam indeks ini 
menunjukkan sebuah better fit. 

d. AGFI(Adjusted Goodness of fit lndex) 

Tingkat penerimaan yang direkomendasikan adalah bila AGFI 
mempunyai nilai yang sama dengan atau lebih besar dari 0.9. 

e. CMIN/DF 

The minimum Sample Discrepancy Function(CMIN) dibagi 
dengan derajat bebas menghasilkan indeks CMIN/DF, yaitu 
salah satu indicator untuk mengukur tingkat kesesuaian sebuah 
model. Nilai chi-square yang diharapkan adalah kurang dari 
atau sama dengan 2.00 
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f. TLI (Tucker Lewis lndex) 

TU adalah sebuah alternative incremental fit index yang 
membandingkan sebuah model yang diuji terhadap sebuah 
baseline model. Nilai yang direkomendasikan sebagai acuan 
untuk diterimanya sebuah model adalah penerimaan lebih 
besar atau sama dengan 0.95. 

g. CFI (Comparative Fit lndex) 

Nilai CFI yang direkomendasikan adalah > 0.95. Semakin 
mendekati 1, maka model semakin baik. Keunggulan dari 
indeks ini adalah bahwa besaran ini besarnya tidak dipengaruhi 
oleh ukuran sampel. 


Indeks-indeks yang dapat digunakan untuk menguji kelayakan sebuah 
model, seperti yang tertera di atas, dapat diringkas dalam tabel berikut: 


Goodness of fit 

Cut-off 

Keterangan 

Chi-square 

Non-signifikan 

Dipakai untuk n = 100-200, Model yg 
baik bila nilai Chi-square tidak jauh 
berbeda dg derajat bebasnya 

RMR 

Kecil 

Dipakai untuk n besar 

RMSEA 

<0.08 

Dipakai untuk n besar 

GFI 

>0.90 

Mirip dengan kocf. determinasi R 2 

AGFI 

>0.9 

Mirip dgn R 2 adjusted 

CFI 

>0.94 

Tdk sensitif thd besar sampel 

AIC 

Kecil 

Bila model lebihdari satu, pilihlah yg 
nilainya kecil 


15.3. Penerapan SEM 

SEM banyak digunakan pada penelitian-penelitian yang variabel- 
variabelnya tidak dapat diukur secara langsung. Penelitian-penelitian ini 
banyak ditemukan di bidang social (ekonomi, sosiometrik, manajemen 
dan lainnya), dalam perkembangan penggunaan metode SEM didorong 
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oleh perkembangan berbagai Software SEM seperti LISREL, AMOS, 
ROMANO, SEPATH, dan LISCOMP. Namun demikian diantara Software 
tersebut, LISREL paling banyak digunakan karena selain kemampuan lisrel 
dalam mengestimasi berbagai masalah SEM, tampilan LISREL juga paling 
informative dalam menyajikan hasil-hasil statistic. Berikut merupakan 
contoh penerapan metode SEM dengan menggunakan Software LISREL. 

Suatu penelitian mengenai keyakinan masyarakat terhadap partai politik 
di Indonesia, untuk itu dambil sampel sebanyak 932. 

Kerangka teori: 

1. keyakinan terhadap partai politik (PARTAI) ditentukan oleh 
keyakinannya terhadap keberhasilan program Partai 
(PROGRAM)) dan keyakinan terhadap kemampuan kemampuan 
pengurus pengurus partai (PENGURUS) 

2. Keyakinan terhadap kemampuan pengurus partai juga 
mempengaruhi keyakinan terhadap keberhasilan program partai 

Selanjutnya untuk mengukur keyakinan terhadap partai politik 

digunakan indikator (X5 dan X6), untuk mengukur keyakinan terhadap 
keberhasilan program partai digunakan dua indikator (X3 dan X4) 
sedangkan untuk mengukur keyakinan terhadap kemampuan 

pengurus partai dengan indicator (XI dan X2). Rincian indicator dan 
variabel dapat dilihat pada tabel berikut: 

Variabel Laten ( Konstruk) Variabel Manifest (Terukur) 

Pengurus XI 

X2 

Program partai X3 

X4 

Partai Politik X5 

X6 
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Model grafis dari kerangka teoritis diatas adalah : 



Gambar 6. Model grafis kerangka teoritis 

Dengan menggunakan program LISREL akan didapatkan output 
dalam bentuk teks dan output grafik. 





Gambar 7. Diagram Lintasan 
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X3 

1.19 





X4 

0.45 

1.00 




xs 

0.5* 

0.39 

1.98 



X6 

0.62 

0.41 

1.49 

1.54 


XI 

0.34 

0.47 

0.44 

0.22 

136 

X2 

0.46 

0.46 

0.61 

0.52 

067 


NuotMr ofl»ncior.i = 12 


LISREL s (Mixurum Lfceltoood) 

Mtasurtosnt Equitior.s 

X3 = 0.72*PRDGRAM. Errwvtf .= 0.6$ . R s »0.44 
( 0 * 12 ) 

5.?6 


X4 = 0.63-PROGRAM. Erravsr * 060 , R* = 0.39 
(0.11) (0.096) 

531 632 


X5 = 1.23♦PARTAI # Error-ir =0.4^ . R- = 0 *6 
(0i4) 

331 


X6 = 1.21 ♦PARTAI. Error.if = 0.074. R= = 095 
(0.12) (0.13) 

10.07 0i8 

XI = 0.73•PENGURUS r Eir<xv*r .= 0.83 . R : - 039 
(0.11) (0.14) 

6.70 6.12 


X2 = 0.93♦PENGURUS, Erroror = 037 . R? =0.60 
(0-12) (0.17) 

768 3.34 

Scrt>cturil Equ*tiwu 

PROGRAM = 0.76*PENGURUS. E.rav*r =0.42, R J =0.58 
(0.14) (020) 

538 2.08 


PARTAI = 0."2♦PROGRAM -0.13♦PENGURUS. Enwvir.-0.60 . R? =0.40 
(030) (0.26) (0.14) 

236 -0.49 4.37 
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PROGRAM «PENGUKUS,Earorw* 0.42, R*“0.58 
(014) 

5i8 

PARTAI = 0 42*PENGURUS, EttWtf “ 0S2. R s = 0.18 
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4.01 
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PENGURUS 

1.00 

Covtriince Mirtx of Lacent Vartables 

PROGRAM PARTAI PENGURUS 

PROGRAM 1.00 

PARTAI 0j62 1j00 

PENGURUS 0.76 0.42 100 

Goodcess of Fii Scetistc s 
D»e«iofFr«doff.*6 

MinimumFtt Panction Ch-Square =24.80(P a 0.00037) 

Normil Theory Weiefcted Latt Square* Chi-Squre * 2400 (P “0.00052) 
Esimited Xon<ef.tr»1ity Parameter (SCP) “18.00 
00 Per ztr.t Conftdence Interval foc NCP = (6.53 ; 37.02) 

Minimum Fit Rsnc tion Vilue “0.1" 

Positron Dtr repancyFunct»n V»b* (PD) =0.12 
90 PercentConfidenceIn®ivilfor F0 =(0.044 ;025) 

Root Mnn Square Error of Approrimation (RMSEA) “ 0.14 
90 J^rcent Confiden:e Inftrvatfor RMSEA =(0.085 : 020) 

P-Value fce T> « of Close Fit (RMSEA <0.05) “0.005" 

Expected Gro»-Yiltdttton Index(ECVI) “036 
90 Pertent Conftdence Interval for E CM =(029; 0.49) 

E CM for Saturated Model * 0 28 
E CM for Independen: t Model = 2.61 
Cb>Square for Independence Model wfch 15 Depeesof Freedom = 3"6.22 
Independetre AIC = 3SS22 
Model AIC - 54.00 
Saturated Al C = 42.00 
Independetre CAIC*412 28 
Model CAIC = 114.16 
Saturated CAI C = 126.22 
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1. Analisis terhadap Hasil Estimasi. 

Pada hasil out put diatas, tidak ada error variances yang 
negative, semua varibel mempunyai t-values > 1,96, berarti 
estimasi muatan faktor tersebut signifikan, dan kecuali X4 (0.63) 
semua nilai muatan faktor standar >0,7. Dengan demikian dapat 
disimpulkan bahwa hasil estimasi muatan faktor dari model baik. 

2. Uji kecocokan model 

Uji kecocokan keseluruhan model 

Nilai Chi-square = 24,00 dan p-value = 0,00052 < 0,05. dapat 
disimpulkan bahwa dari chi-square kecocokan model sudah baik. 
NCP (Non Centrality Parameter)=18,00 yang merupakan nilai 
yang cukup kecil dan 90% confident interval dari NCP sehingga 
berdasarkan NCP dapat disimpulkan kecocokan keseluruhan 
model baik. RMSEA = 0,14 > 0,08 yang menunjukkan keseluruhan 
model kurang baik dan p-value (RMSEA < 0,05) = 0,0057 < 0,005, 
kecocokan model kurang baik. Berikut ini adalah tabel hasil 
rangkuman analisis terhadap ukuran-ukuran goodness Of Fit 
(GOF); 


Ukuran GOF 

Target-tingkat 

Hasil 

Tingkat 



estimasi 

Kecocokan 

Chi-square 

Nilai yang kecil 

X 2 = 24 

Baik 

P 

P > 0,05 

(p=0.000) 


NCP 

Nilai yang kecil 

18,00 

Baik 

Interval 


(6.53 




37,02) 


RMSEA 

RMSEA <0,08 

0,14 

Kurang baik 
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P (close fit) 

P >0,5 


P = 0,0057 


ECVI 

Nilai yang 

kecil 

M* = 0,36 

Kurang baik 


dan 

dekat 

S* = 0,28 



dengan 

ECVI 

1* = 2,61 



saturated 




Al C 

Nilai yang 

kecil 

M* = 54,00 

Baik 


dan 

dekat 

S* = 42,00 



dengan 

Al C 

1* = 388,22 



saturated 




CAIC 

Nilai yang 

kecil 

M* = 114,16 

Baik 


dan 

dekat 

S* = 126,22 



dengan 

CAIC 

1* = 412,28 



saturated 




NFI 

NFI >0,90 


0,93 

Baik 

NNFI 

NNFI >0,90 


0,87 

Baik 

GFI 

GFI >0,90 


0,95 

Baik 

IFI 

IFI >0,90 


0,95 

Baik 

RFI 

RFI >0,90 


0,84 

Baik 

CN 

CN > 200 


102,03 

Kurang baik 

RMR 

Standardized 

0,047 

Baik 


RMR < 0,05 




GFI 

GFI >0,90 


0,95 

Baik 

AGFI 

AGFI > 0,90 


0,82 

Kurang baik 


Dari tabel dapat dilihat bahwa ada 4 ukuran GOF yang 
menunjukkan kecocokan yang kurang baik dan 11 ukuran GOF 
yang menunjukkan kecocokan yang baik, sehingga kita dapat 
menyimpulkan bahwa kecocokan keseluruhan model adalah 
baik. Meskipn demikian, kecocokan keseluruhan model ini masih 
bisa ditingkatkan dengan memanfaatkan informasi yang ada di 
Mod\f\caY\on index. 
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Analisis Model Pengukuran 

Evaluasi terhadap validitas ( volidity ) dari model pengukuran 
dapat dilihat dari nilai t muatan faktor ( foctor looding ) pada 
variabel teramati terhadap laten dari model. Suatu variabel 
mempunyai validitas yang baik terhadap konstruk atau variabel 
latennya jika : 

• Nilai muatan faktornya lebih besar dari kritis (>1,96 atau 
untuk praktisnya >2) 

• Muatan faktor standarnya ( stondordized foctor loodings) > 
0,70 (Rigdon dan Ferguson, 1991) atau >0,50 (lgbaria.et.al., 
1997). ~ 

Dari output dan gambar 7 diperoleh semua nilai t muatan faktor 
> 2, jadi faktor-faktor dari variabel-variabel yang ada dalam 
model adalah signifikan. Kecuali muatan faktor standar (SLF) dari 
X4= 0,62 (> 0,50), semua faktor standar lainnya > 0,70. Dengan 
demikian dapat disimpulkan bahwa validitas semua variabel 
teramati terhadap variabel latennya adalah baik. 

Evaluasi terhadap reliabilitas (reliability) dari model pengukuran 
dapat dilakukan dengan model composite realibity measure 
(ukuran reliabilitas komposit) dan vorionce extrocted meosure ( 
ukuran ekstrak varian). Hasil perhitungan reliabitas diperoleh 
semua nilai Construct reliability (CR) >0,70, dan semua nilai 
Variance Extracted (VE) > 0,50. Dengan demikian dapat 
disimpulkan bahwa reliabilitas model pengukuran (konstruk) 
adalah baik 

Analisis model struktural 

t-value dari koofisien/ parameter: 

• Pengurus —► program : 5,58 > 2, koofisien signifikan 

• Program —► partai : 2,08 >2, koofisien signifikan 

• Pengurus —► partai : -0,49; absolut (-0,49) < 2 koofisien tidak 
signifikan 
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Nilai koofisien/ parameter: 

• Pengurus _^ program : 0,76 

• program _^ partai: 0,72 

• pengurus _^ partai: -0,23 

Koofisien determinasi (R 2 ) 


Menurut Joreskog (R 2 ) pada Structur equation tidak mempunyai 
interpretasi yang jelas dan untuk menginterpretasikan R 2 seperti 
pada persamaan regresi, harus menggunakan reduced form 
equation : 

• pengurus _^ Program : 0,58; berarti 58% dari variasi pada 

partai dijelaskan oleh variasi Pengurus. 

• Pengurus —► Partai : 4,01, berarti 40,1% dari variasi pada 
partai dijelaskan oleh variasi dari pengurus. 

Hasil dari evaluasi ini bisa dirangkum pada tabel dibawah ini 
ditambah dengfan asumsi-asumsi hipotesis-hipotesis dari model 
penelitian sebagai berikut: 

1. Hipotesis 1 : kemampuan pengurus partai mempunyai 
pengaruh positif terhadap keberhasilan program partai. 

2. Hipotesis 2 : keberhasilan program partai mempunyai 
pengaruh positif terhadap partai politik. 

3. Hipotesis 3 : kemampuan pengurus partai mempunyai 
pengaruh negatif terhadap partai politik. 


hipotesis 

Path 

Estimasi 

Nilai-t 

kesimpulan 

1 

Pengurus —► Program 

0,76 

5,58 

Signifikan (Hipotesis 

1 diterima) 

2 

Program—► Partai 

0,72 

2,08 

Signifikan (Hipotesis 

2 diterima) 

3 

Pengurus -Partai 

-0,23 

-0,49 

Signifikan (Hipotesis 

3 diterima) 
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16.Penskalaan Berdimensi Ganda (Multi dimensional 
Scaling) 


16.1. Pendahuluan 

Dalam menyampaikan suatu data atau informasi, seringkali akan lebih 
mudah dan menarik untuk menampilkannya dalam bentuk gambar. 
Termasuk dalam menampilkan data-data (atribut) suatu objek. Posisi 
relatif objek-objek berdasarkan data-data yang dimilikinya, dapat 
ditampilkan dalam sebuah grafik sehingga lebih mudah dibaca oleh 
pengguna informasi tersebut. Multidimensional Scalling adalah salah satu 
tehnik statistika yang dapat diterapkan dalam masalah ini. 

Multidimensional Scaling (MDS) merupakan suatu tehnik eksplorasi yang 
digunakan untuk memvisualisasikan proximifies (kemiripan/ketakmiripan) 
dalam ruang dimensi yang rendah. Dari sudut pandang nonteknis, tujuan 
MDS adalah untuk menyajikan secara visual hubungan beberapa objek 
dalam sebuah grafik. Interpretasi dari keluaran ( output ) yang dihasilkan 
MDS dapat mengarah pada pemahaman yang mendasari kedekatan 
antar objek (entitas). Lebih jauh lagi, dapat dimungkinkan untuk 
menggabungkan objek-objek yang mirip ke dalam satu kelompok yang 
sama. MDS merupakan bagian dari analisis multivariat, karena suatu objek 
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seringkali melibatkan banyak variabel atau peubah yang menjadi atribut- 
atribut objek tersebut. 


16.2. Penskalaan Berdimensi Ganda 

16.2.1. Pengertian Penskalaan Berdimensi Ganda 

Definisi sederhana dari multidimensional scaling adalah pencarian ruang 
dimensi yang kecil (pada umumnya menggunakan euklid) yang dapat 
menyajikan objek-objek sedemikan sehingga jarak antar objek pada 
ruang dimensi tersebut sesuai dengan jarak asli antar objek yang diamati. 
Jarak antar objek bukan hanya berarti jarak secara harfiah tetapi dapat 
pula berarti kemiripan atau ketakmiripan antar objek. 

Dari definisi tersebut, kegunaan multidimensional scaling adalah untuk 
menyajikan objek-objek secara visual berdasarkan kemiripan yang dimiliki. 
Selain itu kegunaan lain dari teknik ini adalah mengelompokkan objek- 
objek yang memiliki kemiripan dilihat dari beberapa peubah yang 
dianggap mampu menggelompokkan objek-objek tersebut. 

Ukuran yang digunakan untuk mengukur hubungan antar objek adalah 
proximity yang berarti “kedekatan” objek yang satu dengan objek 
lainnya. Proximity dapat berupa “kemiripan” {s rt } ataupun “ketakmiripan” 
{8 rt } antar objek, dengan Indeks r dan t melambangkan objek ke r dan 
objek ke t yang dibandingkan. Misalkan suatu himpunan n objek yang 
memiliki ketakmiripan {8 rt } dengan r,t = 1,2, ..., n. Suatu konfigurasi dari n 
titik dalam ruang dimensi p mewakili objek-objek yang diamati, denga 
jarak antar titik dilambangkan dengan {d rt }. Masing-masing titik mewakili 
satu objek dengan titik ke r mewakili objek ke r. Tujuan dari 
multidimensional scaling adalah menemukan suatu konfigurasi sedemikian 
sehingga jarak antar titik sesuai dengan ketakmiripan antar objek. 
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16.2.2. Jenis-jenis Penskalaan Berdimensi Ganda 

Tipe data berdasarkan skala pengukuran dibagi menjadi 4 (empat) tipe, 
yaitu skala nominal, ordinal, interval dan rasio. Berdasarkan tipe data 
tersebut, Penskalaan Berdimensi Ganda dibagi menjadi 2 (dua) jenis, yaitu 
Penskalaan Berdimensi Ganda metrik dan Penskalaan Berdimensi Ganda 
non-metrik 

a. Penskalaan Berdimensi Ganda Metrik 

Data jarak yang digunakan dalam Penskalaan Berdimensi 
Ganda metrik adalah data rasio. Penskalaan Berdimensi 
Ganda metrik digunakan untuk menemukan himpunan titik 
dalam ruang dimensi n dimana masing-masing titik mewakili 
satu objek sehingga jarak antar titik adalah d rt « f(S rt ), 
dimana f adalah fungsi monotonic parametric kontinu. Fungsi 
ini dapat berupa fungsi identitas maupun fungsi transformasi 
ketakmiripan menjadi bentuk jarak. 

Jenis Penskalaan Berdimensi Ganda metrik yang sering 
digunakan adalah yang diperkenalkan oleh Young dan 
Householder pada Tahun 1938. Dalam penskalaan klasik 
ketakmiripan { 8 rt } diperlakukan sebagai jarak euklid. Misalkan 
koordinat n titik dalam ruang euklid dimensi p adalah 
x r (r = 1 , ••• , 7t) , dimana x r (x rl ,---x rp ) T . Jarak euklid antara 
titik ke r dan t adalah : 

drt = (Xr - XtV(x r -Xt) . ( 1 ) 


Misalkan matriks hasil kali dalam B, dimana 
[B] rt = b rt = x T r x t 


Dengan Y? =1 x ri = 0 (i = l, — ,p) 

Untuk mencari B dari persamaan (1) diperoleh : 
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( 2 ) 


I x^ x^ 2x^ x^ 


- ^ dl t = — 'V" XyX r + xTx t , 

n Z—i n Z—i 

r=l r=l 


il*-' 

t=l 


X r + — ^ xl x t , 

t=1 

^=llUd 2 rt =^ = 1 X T r X r 


(3) 


Disubstitusi ke dalam persamaan (2) menjadi 


fr rt = 


1 

2 




d r 2 t + ^Z? =1 I?=i 



= Cl r t — CL r — CL t + CL .(4) 

Dimana a rt = dan 



Matriks A didefinisikan sebagai [A\ rt = a rt , dan karena hasil 
kali dalam matriks B adalah 

B= HAH . 

(5) 

Dimana H = I-n _1 ll T dengan 1 = ( 1, 1, ... , 1 ) r adalah 
vector 1 berukuran n. 

Matriks hasil kali dalam B dapat juga diekspresikan sebagai 
B = XX T , dimana X = [x 1 ,---,x n ] T adalah matriks koordinat 
berukuran n x p. Pangkat dari matriks B, r(B) adalah 
r(B) = r(XX T ) = r(X) = p. 
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Sekarang B adalah matriks yang simetrik, semi definit positif 
dan berpangkat p, sehingga memiliki p akar ciri nonnegative 
dan n-p akar ciri 0. 

Matriks B kemudian ditulis dalam bentuk dekomposisi spectral, 
B = VAV T , dimana A=diag(Ai,A 2 , ... , A n ), yaitu matriks diagonal 
dari akar ciri {Ai} matriks B, dan V = [vi, ... , v n ], yaitu matriks 
vektor akar ciri yang dinormalkan menjadi vjv t = 1. Akar ciri 
yang diperoleh kemudian disusun menjadi Ai > A 2 ^ ... >A n > 0. 
Karena memiliki n-p akar ciri 0, maka matriks B dapat ditulis 
kembali sebagai B = ViAiVi 1 , dimana Ai = diag(Ai, ..., A p ) , Vi 
i [vi.v p ]. 

Karena B = XX T , maka koordinat matriks X adalah X = ViAi 1/2 , 
dimana Ai 1/2 = diag(Ai 1/2 , ...,A P 1/2 ) . 

Penggunaan classical scaling biasanya lebih banyak 
mengenai ketakmiripan { 8 rt } dibandingkan dengan jarak 
euklid sebenarnya antar titik { d rt }. 

Menurut Mardia et al, jika B adalah semi definit positif 
berpangkat p, maka B = VAV T =XX T , dimana X = [x r ] T , x r = A 1/2 v r . 
Jarak antara titik ke r dan ke t dari konfigurasi adalah 
(x r - x s ) T (x r - x t ), diperoleh 

(x r — x t ) r (x r — x t ) = xjTx r + xjx t — 2XyX t 
= b rr + b tt - 2 b rt 
— u rr + 2 a rt — 2 a rs — 8 r ^ 

Dengan 8? t sama dengan jarak antara titik r ke t dalam ruang 
euklid. 

Jika koefisien ketakmiripan menyebabkan matriks B tidak semi 
definit positif, suatu konstanta dapat ditambahkan pada 
semua koefisien ketakmiripan (kecuali { 8 rr }) sehingga matriks 
B menjadi matriks semi definit positif. Bentuk koefisien 
ketakmiripan yang baru menjadi 8 rt = 8 rt + c( 1 - 8 rt ) , 

dimana c adalah suatu konstanta dan 8 rt adalah kronecker 


380 



delta (8 rt = 1 jika r = t dan 0 untuk lainnya, tidak ada 
hubungan dengan 8 rt ). 

Permasalahan berikutnya adalah menentukan jumlah dimensi 
yang diperlukan untuk menampilkan koefisien ketakmiripan 
{5 rt } . Jika B adalah matriks semi definit positif maka jumlah 
akar ciri yang tak nol menujukkan jumlah dimensi yang 
diperlukan. Jika B bukan matriks semi definit positif maka 
jumlah akar cirri yang positif menunjukkan jumlah dimensi 
yang tepat. Jumlah dimensi tersebut merupakan jumlah 
dimensi maksimal yang diperlukan, sedangkan untuk lebih 
praktisnya lebih baik memilih dimensi yang lebih kecil. 

Dari persamaan (3), jumlah kuadrat jarak antar titik dalam 
ruang adalah 


n n n 

r=ls=l r=1 


n-1 

: n tr B = n ^ h 


Suatu ukuran proporsi variasi yang dijelaskan dengan 
menggunakan hanya dimensi p adalah 

Jika B bukan matriks semi definit positif, ukuran tersebut 
dimodifikasi menjadi 


gU h 

2(a/car ciri positif ) 

Ukuran tersebut dapat digunakan untuk memilih jumlah 
dimensi (p) yang akan digunakan. 


Secara singkat algoritma classical scaling sebagai berikut: 


381 



1. Menentukan koefisien ketakmiripan { 8 rt } 

2. Mencari matriks A = [- ^ 

3. Mencari matriks B = [a rt - a r _ - a s + a ] 

4. Mencari akar cirri Ai , ... , A n -i dan vektor ciri vi, ... , v n -i 
yang kemudian dinormalkan sehingga v\v t = h . Jika B 
tidak semi definit positif ( beberapa akar ciri bernilai 
negatif), maka terdapat 2 pilihan, pilihan 1 adalah 
membuang akar ciri yang bernilai negatif dan 
melanjutkan proses. Pilihan ke 2 adalah menambahkan 
suatu konstanta c pada koefisien ketakmiripan sebagai 
berikut S r t — firt “k c( 1 - S rt ) dan kembali ke langkah 2. 

5. Memilih jumlah dimensi yang tepat. Dapat 
menggunakan £?4i/I](aA:ar ciri positif). 

6. Menentukan koordinat n titik pada ruang euklid dimensi p 

dengan x ri = v ir (r = 1,...,n; i = 

b. Penskalaan Berdimensi Ganda Non Metrik 

Data jarak yang digunakan dalam Penskalaan Berdimensi 
Ganda non metrik adalah data yang dianggap bertipe 
ordinal. Untuk Penskalaan Berdimensi Ganda non metrik, 
fungsi transformasi hanya mempunyai batasan 8 rt < A r - t - => 
/(5 rt ) < /(5 r v) untuk semua 1 < r,t,r ' ,t < n. Suatu fungsi stress 
sebagai berikut: 


Stress = 


^rt) 


2r,t d r 


Fungsi ini mengambil 1 = r < s = n, karena d st — d ts untuk 
semua r, t. Meminimumkan Fungsi stress dengan 
memperhatikan { d rt j dan { d rt } menggunakan regresi isotonic. 
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Dalam berbagai literatur regresi isotonic mempunyai arti 
regresi kuadrat terkecil monoton utama dari {d rt } pada {5 rt }. 


Ide untuk menemukan tampilan dari objek-objek dalam titik 
pada ruang dimensi q sedemikian sehingga nilai stress sekecil 
mungkin. Kruskal menyarankan bahwa dengan nilai stress 
dapat kebaikan suai dari hubungan monotonic antara 
kemiripan dan jarak akhir, dengan ketentuan nilai sebagai 
berikut 


STRESS(%) 

Kesuaian 

20 

Buruk 

10 

Cukup 

5 

Bagus 

2.5 

Sangat bagus 

0 

Sempurna 


Langkah pertama meminimumkan Stress adalah 
menempatkan semua koordinat titik dalam X dalam suatu 
vectorx= (xn, ... ,xi p , ... , x np ) T sehingga stress sebagai fungsi 
dari x yang diminimumkan dengan cara iteratif. Metode 
penurunan tajam digunakan, sehingga jika x m adalah vector 
koordinat setelah iterasi ke m 
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Xm +1 — Xm 


= Slr,t(d ru - d tu ) _ £] * 


I x ri x ti\* 


signum (x ri - x ti ) 


Berikut adalah teknik iteratif Kruskal yang digunakan untuk 

menemukan konfigurasi dengan nilai stress minimum : 

1. Memilih suatu konfigurasi awal. 

2. Menormalisasi konfigurasi untuk mendapatkan centroid 
pada data aslinya dan jarak kuadrat tengah unit dari 
data aslinya 5 rt . Hal ini dilakukan karena stress invariant 
terhadap translasi, dilatasi seragam. 

3. Tentukan 8 rt dari konfigurasi yang telah dinormalkan. 

4. Menyesuaikan d rt . Regresi kuadrat terkecil monotonic 
dari d rt pada 8 r t membagi $rt menjadi blok-blok dimana 
d rt konstan, dan sama dengan nilai tengah dari d rt . Untuk 
menemukan partisi 8 r t yang tepat, partisi terbaik 
digunakan adalah yang memiliki N blok dengan masing- 
masing berisi suatu ^menggunakan notasi alternatif. Jika 
partisi ini memiliki d 1 < d 2 < ■■■ < d N , dan d t = d t maka 
partisi ini merupakan partisi yang tepat. Jika tidak 
demikian maka blok yang berurutan digabung dimana 
8 t > S i+1 dan d t = d i+1 = (d t + d i+1 )/ 2. Blok terus-menerus 
digabung dan d t baru selalu diperoleh hingga partisi 
yang dibutuhkan tercapai. 

5. Temukan gradient —. Jika I—I < e , dimana e adalah nilai 

dx \dx\ 

yang sangat kecil. Jika suatu konfigurasi dengan stress 
minimum diperoleh maka proses iteratif berhenti. 

6. Temukan panjang sl. 
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dS_ 

7. Temukan konfigurasi yang baru, yaitu x n+1 = x n - sZ-rffr 

\dx\ 

8. Kembali ke langkah 2. 


16.3. Ilustrasi 


Berikut adalah data jarak antar pasangan kota terpilih di US. 



Atla 

nta 

Bost 

on 

Cinci 

nnati 

Colou 

mbus 

Dallas 

Indiana 

polis 

Little 

Rock 

Los 

Angeles 

Mem 

phis 

St. 

Louis 

Spok 

anes 

Tampa 

Atlanta 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

Boston 

1068 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

Cincinnati 

461 

867 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

Coloum 













bus 

549 

769 

107 

0 

0 

0 

0 

0 

0 

0 

0 

0 

Dallas 

805 

1819 

943 

1050 

0 

0 

0 

0 

0 

0 

0 

0 

Indianap 













olis 

508 

941 

108 

172 

882 

0 

0 

0 

0 

0 

0 

0 

Little 













Rock 

505 

1494 

618 

725 

325 

562 

0 

0 

0 

0 

0 

0 

Los 













Angeles 

2197 

3052 

2186 

2245 

1403 

2080 

1701 

0 

0 

0 

0 

0 

Memphis 

366 

1355 

502 

586 

464 

436 

137 

1831 

0 

0 

0 

0 

St. 













Louis 

558 

1178 

338 

409 

645 

234 

353 

1848 

294 

0 

0 

0 

Spoka 

24 

27 

206 










nes 

67 

47 

7 

2131 

1891 

1959 

1988 

1227 

2042 

1820 

0 

0 


46 

13 








101 

282 


Tampa 

7 

79 

928 

985 

1077 

975 

912 

2480 

779 

6 

1 

0 
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Dimension 2 


Derived Stimulus Configuration 


Euclidean distance model 


spokane 

O 


in< 


icjianapolis Ocolumbus 

St.louis cincinnati 
O 


boston 

O 


los_angeles 

O 


memphis 

O 


atlanta 

O 


dallas 

O 


tampa 

O 


Dimension 1 


Tunjukkan posisi kota-kota di atas menggunakan penskalaan 
berdimensi ganda. 

Dengan menggunakan SPSS 15, menghasilkan output: 

Dari gambar di atas tampak bahwa kota Indianapolis, Columbus, 
Cincinnati, St.Louis saling berdekatan dibandingkan dengan kota-kota 
lain dan tampak berada dalam wilayah yang sama. Jarak paling jauh 
adalah antara kota Boston dan Los Angeles serta antara Spokane dan 
Tampa. 
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Stress and Fit Measures 


Normalized Raw 

Stress 

.00047 

Stress-I 

.02168(a) 

Stress-ll 

.03934(a) 

S-Stress 

.00117 (b) 

Dispersion 


Accounted For 

.99953 

(D.A.F.) 


Tucker's Coefficient 

of Congruence 

.99976 


PROXSCAL minimizes Normalized Raw Stress. 


a Optimal scaling factor = 1.000. 
b Optimal scaling factor = 1.001. 

Dari nilai Koefisien Tucker yang dihasilkan sebesar 0.99976 hampir 100% 
yang berarti model multidimensional scaling sempurna. Hal ini dapat 
terjadi karena data yang digunakan adalah data jarak antar kota 
yang biasa digunakan dalam 2 dimensi. Ini didukung pula dengan nilai 
Normalized Raw Stress yang hanya sebesar 0.00047, yang berarti 
hampir 100% data dapat dijelaskan oleh multidimensional scaling. 
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Decomposition of Normalized Raw Stress 



Source 

Mean 


SRC_1 

SRC_1 

Object atlanta 

.0004 

.0004 

boston 

.0006 

.0006 

cincinnati 

.0001 

.0001 

columbus 

.0001 

.0001 

dallas 

.0002 

.0002 

indianapolis 

.0002 

.0002 

little_rock 

.0003 

.0003 

los_angeles 

.0013 

.0013 

memphis 

.0001 

.0001 

St.louis 

.0001 

.0001 

spokane 

.0019 

.0019 

tampa 

.0004 

.0004 

Mean 

.0005 

.0005 


Tabel ini menjelaskan tentang objek-objek yang memberikan kontribusi 
paling besar terhadap stress. Berdasarkan tabel tersebut kota Spokane 
memberikan kontribusi terbesar terhadap nilai stress, yaitu sebesar 0.0019. 
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Iteration History 


Iteration 

Normalized 

Raw Stress 

Improvement 

0 

.23972(a) 


1 

.02270 

.21701 

2 

.01611 

.00660 

3 

.01199 

.00411 

4 

.00900 

.00299 

5 

.00678 

.00222 

6 

.00512 

.00166 

7 

.00387 

.00125 

8 

.00293 

.00094 

9 

.00223 

.00070 

10 

.00171 

.00052 

11 

.00133 

.00039 

12 

.00104 

.00029 

13 

.00083 

.00021 

14 

.00067 

.00016 

15 

.00056 

.00012 

16 

.00047 

.00009 (b) 


a Stress of initial configuration: simplex start. 

b The iteration process has stopped because Improvement has 
become less than the convergence criterion. 


389 









Tabel iterasi history menunjukkan proses iterasi hingga diperoleh nilai 
stress yang konvergen. Untuk analisis data digunakan criteria iterasi 
untuk kekonvergenan stress sebesar 0.0001. 


16.4. Aplikasi SAS 

Untuk melakukan analisis MDS, kita menggunakan nilai-nilai yang 
menggambarkan tingkat kemiripan atau pun tingkat ketakmiripan antar 
objek. Nilai-nilai tersebut sering disebut sebagai proximity 

• similority (kemiripan) jika semakin besar nilai menunjukkan bahwa 
objek nya lebih mirip 

• dissimilarity (ketakmiripan) jika semakin besar nilainya menunjukkan 
bahwa objeknya semakin tidak mirip 

Jika menggunakan SAS, prosedur yang digunakan untuk penskalaan 
dimensi ganda adalah PROC MDS. 

Sebagai ilustrasi penggunaan PROC MDS pada SAS, misalnya kita memiliki 
data tentang jarak antar kota, kita bisa membuat peta lokasi berdasarkan 
data tersebut dengan menggunakan multidimensional scaling. Berikut ini 
akan kita lakukan analisis terhadap data jarak beberapa kota di Amerika. 
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Penyiapan datanya adalah sebagai berikut: 


data 

city; 






title 

'Analysis 

of Flying 

Mileages Between Ten U.S 

. Cities'; 

input 

(atlanta 

chicago denver 

houston losangeles miami newyork 

sanfran seattle 

washdc) (5 

.) @56 city $15.; 


datalines; 







0 







Atlanta 

587 

0 






Chicago 

1212 

920 

0 





Denver 

701 

940 

879 

0 




Houston 

1936 

1745 

831 

1374 

0 



Los Angeles 

604 

1188 

1726 

968 

2339 

0 


Miami 

748 

713 

1631 

1420 

2451 

1092 

0 

New York 

2139 

1858 

949 

1645 

347 

2594 

2571 0 

San Francisco 

2182 

1737 

1021 

1891 

959 

2734 

2408 678 0 

Seattle 

543 

597 

1494 

1220 

2300 

923 

205 2442 2329 0 

Washington D.C. 


Proximity yang ada adalah jarak antara dua kota. Karena jarak bersifat 
simetrik, jarak antara Chicago ke Atlanta sama dengan jarak Atlanta ke 
Chicago, maka hanya setengah dari tabel saja yang perlu dimasukkan. 


Selanjutnya kita gunakan PROC MDS dari SAS/STAT untuk membuat data 
set yang berisi koordinat titik-titik kota yang akan di plot. 

proc mds data=city level=absolute out=out; 

id city; 
run; 


Beberapa option pernyataan pada PROC MDS yang digunakan adalah 

LEVEL= menyebutkan sakai pengukuran data. Karena kita 
menyebutkan LEVEL=ABSOLUTE jarak antara koordinat 
yang di plot akan sama dengan jarak aslinya. 

OUT= membuat data set yang berisi koordinat dari kota-kota 
dan statistik lain hasil analisis 

ID = merupakan pernyataan yang menyatakan peubah 

mana yang dijadikan nama objek. 
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Option OUT= akan menghasilkan gugus data hasil analisis menggunakan 
PROC MDS yang memuat peubah DIM1 dan DIM2, yang nilainya 
menunjukkan koordinat titik yang ingin diplot. Jika kita mebuat plot dari 
koordinat itu : 

tambahkan label pada plot sebagai identitas titik 
gambar sumbu vertikal dan horizontal dengan skala yang sama. 
Jika kita lakukan dengan cara ini, maka jarak terlihat dengan 
benar. 

Untuk membuat plot hasil keluaran PROC MDS ini bisa digunakan alat-alat 
yang ada di SAS System, antara lain : 

makro %PLOTIT, makro yang disediakan oleh SAS/STAT sample 
library 

PROC PLOT, prosedur yang disediakan oleh Software SAS 

Menampilkan plot dengan makro %PLOTIT 

Kita bisa menggunakan makro %PLOTIT untuk membuat plot dari hasil 
keluaran PROC MDS. Makro ini merupakan bagian dari SAS/STAT sample 
library dan bisa ditemukan pada SAS Release 6.08 atau yang lebih baru. 

Makro %PLOTIT bekerja dengan menampilkan titik-titik dan label sehingga 
mereka tidak saling tumpang tidih di plot yang dihasilkan. 

Pada contoh di atas, perintah yang diberikan adalah 


%plotit(data=out, datatype=mds, labelvar=city, plotvars 
= dim2 diml, labfont=swissb); 

run; 
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Nilai nilai masukan untuk makro ini adalah : 


DATA= menyebutkan data yang menjadi input makro, yaitu 

data yang diperoleh dari option OUT= pada PROC 
MDS 


PLOTVARS= menyebutkan peubah yang dijadikan sumbu vertical 
dan horizontal pada plot 

DATATYPE= menyebutkan tipe analisis data yang digunakan 
untuk menghasilkan data tersebut. DATATYPE=MDS 
berarti menyatakan bahwa data dihasilkan dari 
multidimensional scaling. 


LABELVAR= menyebutkan peubah apa yang dijadikan label titik 
di plot. Pada contoh ini digunakan peubah CITY. 


* Houston * Miami 

* Los Angeles 


San Francisco 

* Atlanta 

* Denver 

Washington D.C. 

Chicago 

* * 

: Seattle 

* New York 


Plot tersebut menunjukkan posisi relatif masing-masing kota. Karena kita 
menspesifikasi LEVEL=ABSOLUTE dalam tahapan di PROC MDS, skala pada 
salb sumbu sama dengan skala pada data yang diinput. 
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Karena orientasi arah pada plot adalah semabrang, maka arah utara 
bukan pada bagian atas grafik. Pada plot ini, arah utara ada di bagian 
dasar grafik. PROC MDS menempatkan titik asal di tengah-tengah 
konfigurasi. 

Walaupun tidak harus dan tidak mengubah interpretasi, kadangkala 
diperlukan mengganti arah grafik. Misalnya pada grafik di atas kita bisa 
mengalikan peubah DIM2 dengan -1 dan selanjutnya membuat plot 
dengan DIM1. 

data out; 
set out; 

dim2 = -1* dim2; 

run; 

%plotit (data=out, datatype=mds, labelvar=city, plotvars = dim2 diml, 
labfont=swissb); 

run; 


* Seattle 

* New York 

Chicago 

* * 

Washington D.C. 

* Denver 


* San Francisco 

* Atlanta 

* Los Angeles 

* 

Houston * Miami 


sekarang arah utara ada di bagian atas grafik. 
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17 


17.Analisis Konjoin (Conjoint Analysis) 


17.1. Pendahuluan 

Analisis konjoin (conjoint analysis ) merupakan suatu metode analisis dalam 
analisis multivariate, analisis ini mulai diperkenalkan pada tahun 1970-an 
(Cattink and Wittink, 1992). Analisis ini biasa diterapkan pada market riset 
dan studi pengembangan produk. Analisis konjoin adalah sebuah teknik 
guna mengukur preferensi konsumen terhadap produk atau jasa. Analisis 
konjoin berdasarkan pada subjektifitas konsumen terhadap beberapa 
kombinasi fitur yang ditawarkan. Subjektifitas konsumen ini diukur melalui 
peringkat (rank) atau skore (skala likert). Hasil analisis konjoin berupa 
informasi kuantitatif yang dapat memodelkan preferensi konsumen untuk 
beberapa kombinasi fitur produk. Sebagai contoh, ketika konsumen 
hendak membeli komputer mungkin akan memeriksa himpunan atribut 
untuk memilih produk mana yang paling cocok dengan kebutuhannya. 
Konsumen mungkin akan mempertimbangkan unsur kecepatan, merek 
motherboard, daya tampung memori, jenis VGA card dan lain-lain. 
Pengukuran dan analisis dalam penelitian pemasaran untuk memilih suatu 
produk biasanya dilakukan dengan menggunakan analisis conjoin. 

Dalam prosesnya analisis konjoin akan memberikan ukuran kuantitatif 
terhadap tingkat kegunaan (utility) dan kepentingan relatif (relatif 
importance ) suatu atribut dibandingkan dengan atribut lain. Hal ini 
dilakukan melalui pertimbangan psikologis atau preferensi konsumen 
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(Green & Tuli, 1988). Lebih lanjut, nilai-nilai ini dapat digunakan untuk 
membantu menyeleksi atribut-atribut suatu produk yang akan ditawarkan. 

Tujuan analisis konjoin adalah memperoleh skor kegunaan ( utility ) yang 
dapat mewakili kepentingan setiap aspek produk, sehingga dari skor 
tersebut dapat ditarik kesimpulan tentang atribut apa yang paling 
dipertimbangkan konsumen dalam memilih produk. Dalam pemasaran 
teknik analisis konjoin biasanya digunakan untuk hal-hal berikut: 

1. Menentukan tingkat kepentingan relative atribut-atribut pada proses 
pemilihan yang dilakukan oleh konsumen .Output baku dari analisis 
conjoin terdiri dari kepentingan relative dari timbangan yang 
diturunkan untuk semua atribut yang dipergunakan untuk 
membangun stimulus yang diperuntukan dalam tugas evaluasi. 
Kepentingan relative timbangan (w eights) menunjukan atribut mana 
yang penting dalam mempengaruhi pilihan pelanggan. 

2. Membuat estimasi pangsa pasar suatu produk tertentu yang 
berbeda tingkat atributnya. The Utilities yang diturunkan dari analisis 
conjoin bisa dipergunakan sebagai input ke dalam suatu pilihan 
simulator untuk menentukan sumbangan pilihan, kemudian pangsa 
pasar dengan berbagai jenis merk. 

3. Menentukan komposisi produk yang paling disukai konsumen. 
Feature dari merk dapat dibuat bervariasi dinyatakan dalam 
tingkatan/level atribut dan Utilities yang bersangkutan ditentukan. 
Feature dari merk yang menghasilkan utility tertinggi menunjukan 
komposisi merk yang paling disenangi. 

4. Membuat segmentasi pasar yang didasarkan pada kemiripan 
preferensi terhadap tingkat-tingkat atribut. Fungsi parth-worth 
diturunkan untuk atribut, mungkin dipergunakan sebagai basis 
(dasar) untuk mengelompokkan (clustering) responden untuk 
mencapai segmen dreferensi yang homogeny. 
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Sementara manfaat yang dapat diambil dari penggunaan analisis konjoin 

adalah produsen dapat mencari solusi kompromi yang optimal dalam 

merancang atau mengembangkan suatu produk. Menurut Green dan 

Krieger (1991) analisis ini dapat juga dimanfaatkan untuk : 

1. Merancang harga 

2. Memprediksi tingkat penjualan atau penggunaan produk (market 

share), uji coba konsep produk baru. 

3. Segmentasi preferensi 

4. Merancang strategi promosi 

17.2. Statistik Dalam Analisis Konjoin 

Statistik yang sering muncul dalam analisis conjoin adalah : 

• Port-worth function [utility function ) ialah kegunaan ( utility ) yang 
dikaitkan oleh pelanggan pada tingkatan//eve/ setiap atribut. 

• Relatif importance weight ialah nilai yang bisa menunjukan atribut 
mana yang penting di dalam pilihan pelanggan. 

• Atribut level ialah nilai yang menunjukan tingkatan setiap atribut. 

• Full profiles atau complete profiles dan merk yang dibentuk 
dinyatakan dalam semua atribut dengan menggunakan atribut 
level yang ditentukan oleh desain. 

• Pairwise table , responden mengevaluasi dua atribut pada saat 
yang sama, sampai semua pasangan atribut sudah dievaluasi. 

• Cyclical design ialah desain yang dipergunakan untuk 
mengurangi banyaknya pasangan yang harus diperbandingkan. 

• Factional factorial design ialah desain yang dipergunakan untuk 
mengurangi banyaknya profil stimulus yang dievaluasi di dalam 
pendekatan profil penuh. 

• Orthogonal arrays ialah sebuah kelas desain factorial yang 
memungkinkan untuk membuat perkiraan yang efesien dari 
seluruh pengaruh utama. 
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Internal validity meliputi korelasi antara evaluasi untuk hold out yang 
diprediksi atau validasi stimulus dengan hasil yang diperoleh dari para 
responden. 

1. Tahapan Analisis Konjoin 

Tahapan yang umumnya dilakukan dalam merancang dan 
melaksanakan analisis konjoin secara umum ditampilkan dalam 
Gambar berikut: 


MERUMUSKAN MASALAH 



MERANCANG KOMBINASI ATRIBUT 



MENENTUKAN JENIS DATA 



MEMILIH PROSEDUR ANALISIS KONJOIN 



INTERPRETASI HASIL 



U II PFI IARII ITAS DAN VAI IDITAS H ASM 


Gambar 1. Tahapan Analisis Konjoin 
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1. Perumusan masalah 

Di dalam merumuskan analisis conjoin, peneliti harus 
mengenali/mengidentifikasi atribut dengan tingkatan/level masing- 
masing dipergunakan untuk membentuk stimulus. Level atribut 
menunjukkan nilai yang diasumsikan oleh atribut. Atribut yang dipilih 
harus dapat mempengaruhi preferensi dan pilihan pelanggan. 
Atribut bisa diidentifikasi melalui diskusi dengan manajemen dan 
tenaga ahli, menganalisis data sekunder, riset kualitatif dan lain-lain. 
Banyaknya tingkatan atribut menentukan banyaknya parameter 
yang akan diperkirakan dan juga mempengaruhi banyaknya 
stimulus yang akan dievaluasi oleh responden. Untuk 
meminimumkan tugas evaluasi responden, peneliti harus bisa 
memperkirakan parameter seakurat mungkin, perlu membatasi 
banyaknya tingkatan/level dari atribut. Peneliti harus 
memperhitungkan level atribut yang lazim atau umum berlaku di 
masyarakat . Menggunakan level atribut di luar kisaran yang 
tercemin di dalam pasar akan mengurangi believability dari tugas 
evaluasi, akan tetapi akan meningkatkan akurasi dengan mana 
parameter akan diestimasi. 

2. Merancang kombinasi atribut (stimuli) 

Terdapat beberapa ketentuan dalam memilih metode yang akan 
digunakan dalam merancang kombinasi taraf dari atribut (Hair et 
al.. 1998), yaitu : 

a. Choice-Based conjoin (CBC). Digunakan apabila jumlah atribut 
<6 

Metode ini mulai popular pada awal tahun 1990-an, dan saat ini 
banyak digunakan serta mendapat perhatian yang sangat 
besar oleh kalangan peneliti dan praktisi pemasaran. Menurut 
Hair et al. (1998) keunggulan utama CBC dibandingkan metode 
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lain adalah prosedur pengumpulan datanya secara langsung 
mencerminkan prilaku pasar. Metode CBC tidak tepat 
digunakan dalam penelitian dengan jumlah atribut yang 
banyak. Green dan Srinivasan (1990), menyatakan bahwa 6-10 
atribut adalah jumlah maksimum atribut yang dapat 
menggunakan konsep full-profile dalam analisis conjoin. 

b. Traditional Conjoin, digunakan apabila jumlah atribut < 10 

c. Adaptive Conjoin Analysis (ACA), digunakan apabila jumlah 
atribut >10. 

Adapun pendekatan yang sering digunakan dalam merancang 
kombinasi atribut yang sering digunakan adalah : 

a. Kombinasi berpasangan (pairwise combinotion) 

Responden diminta untuk mengevaluasi pasangan-pasangan 
atribut secara bersamaan. 

b. Kombinasi lengkap (full profile ) 

Responden diminta mengevaluasi semua kombinasi stimuli yang 
muncul. 

Jika jumlah kombinasi terlalu banyak maka dilakukan pengurangan 
jumlah kombinasi atribut (stimuli) tersebut. Salah satu cara dengan 
orthogonal array sehingga akan diperoleh suatu kombinasi atribut 
yang hanya mengukur efek utamanya saya , sementara interaksi 
antar atribut tidak terukur atau diabaikan dan jumlah stimuli yang 
terbentuk akan berkurang. 

3. Menentukan jenis data yang diperlukan 

Jenis-jenis data pada analisis konjoin, yaitu : 

• Nonmetrik (data dalam bentuk nominal atau ordinal atau 
ordinari) 

Membuat ranking atau mengurutkan stimuli yang telah 
dibuat pada tahap sebelumnya. Pengurutan ini biasanya 
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dimulai dari stimuli yang paling disukai sampai pada stimuli 
yang paling tidak disukai. 

• Metrik (data berskala interval atau rasio) 

Memberikan rating atau nilai terhadap masing-masing stimuli. 
Dalam konjoin analisis yang berperan sebagai vaiabel tak bebas 
(<dependent vorioble) umumnya adalah preferensi atau keinginan 
untuk membeli. Oleh karenanya pemberikan urutan maupun 
penilaian didasarkan atas kedua hal tersebut. Namun demikian 
karena proses konjoin bersifat sangat fleksibel maka pembelian 
secara aktual maupun pilihan dapat berlaku sebagai variabel tak 
bebas. 

Pemberian nilai atau rating dapat dilakukan melalui beberapa cara: 

a. Menggunakan skala lickert mulai dari 1 hingga 9(1= Paling 
tidak disukai, 9 = Paling disukai). 

b. Menggunakan nilai rangking terbalik, artinya untuk stimuli yang 
paling disukai diberi nilai tertinggi setara dengan jumlah 
stimulinya, sedangkan stimuli yang paling tidak disukai diberi 
nilai 1. 

4. Memilih prosedur analisis conjoin 

Konjoin termasuk dalam Multivariate Dependence Method , yaitu 
hubungan antar variablenya depedensi. Hubungan depedensi yaitu 
jika variable-variabel yang diteliti secara teoritis dapat dipisahkan 
kedalam variable-variabel respon dan variable penjelas (Santoso, 
2002) dengan model sebagai berikut: 


v= x ± +x 2 +x 3 + ... + x k 





nonmetrik 


ata 
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Variabel independen (X) adalah factor dan berupa data nonmetrik. 
Termasuk disini adalah bagian dari factor (level), sedangkan variable 
dependen (Y) adalah pendapat keseluruhan (overall preference) dari 
seorang responden terhadap sekian factor dan level pada sebuah 
produk. 

Secara umum model dasar analisis Conjoin dapat ditulskan dalam 
bentuk sebagai berikut: 

m A-w 

c/<jo= z z a,*» 

*=1 j =1 

Keterangan : 

U(X) = Utility total 

jflj = Fort worth atau nilai kegunaan dari atribut ke-/ 

taraf ke-/. 

-k/ = Taraf ke-/ dari atribut ke-i 

m = Jumlah atribut 

xij = Dummy variable atribut ke-i taraf ke-/, (bernilai 1 
bila taraf yang berkaitan muncul dan 0 bila tidak) 

Fungsi kegunaan (utility function) yang nantinya akan diduga sangat 
dipengaruhi oleh model yang sangat dipengaruhi oleh model yang 
akan digunakan di bawah ini: 


1. 


2 . 

3 . 


Factor diskret 

( aj k , untuk k = 1,2 ,..., mj — 1 
— ^ ocj k , untuk k = mj 

Factor linier ujk = j3\ Xk 

Factor ideal-point ujk = £ fjizjk + y \2 z 2 jk 
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Salah satu metode yang dapat digunakan untuk menyelesaikan 
model dari analisis conjoin adalah metode regresi dengan variable 
dummy. 

Untuk atribut ke-j dengan kj level, variable dummynya adalah : 


Tabel.l. Variabel Dummy Atribut ke-j dan level kj 


Level 

Xi 

X 2 


Xkj-1 

1 

1 

0 


0 

2 

0 

1 


0 

3 

0 

0 


0 






kj - 1 

0 

0 


1 

kj 

0 

0 


0 


Langkah yang paling penting dalam analisis conjoin adalah 
mengestimasi kegunaan (utility function) atau tingkat kepentingan 
relative individu (individual level part worth) 

Untuk mendapatkan nilai-nilai u jkji tersebut, langkah yang harus 
dilakukan adalah mengestimasi model dasar analisis conjoin dengan 
persamaan regresi linier ganda dengan variable dummy. Maka 
persamaan regresinya adalah : 

y i = Po + Pl i + Pn + ■■■ + Pk X ki + £ i 

Untuk menaksir parameter pada persamaan di atas maka akan 
digunakan metode kuadrat terkecil. 
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Pentingnya suatu atribut, misalkan RANGEi dinyatakan dalam kisaran 
Part Worth melintasi level dari atribut, yaitu : 

RANGEi = jmax (uj kj ^j — min J, untuk setiap i 

Pentingnya suatu atribut digunakan untuk meyakinkan kepentingan 
relative disimbolkan dengan IMP yang ditentukan melalui formula 
berikut: 


IMPi 


RANGE 
Ef =1 RANGEi 


X 100% 


Setelah didapatkan nilai-nilai Uj kji , maka kisaran part worth RANGEid 
an timbangan kepentingan relative IMPi akan diperoleh. Kisaran part 
worth dan timbangan kepentingan relative ini memberikan dasar 
untuk menginterpretasikan hasil. Angka IMPi yang terbesar 
menunjukan preferensi terbesar terhadap level-level pada atribut 
tertentu. 


17.3. Ilustrasi 

17.3.1. Metric Conjoint Analysis 

Contoh ini memberikan gambaran sederhana analisis konjoin / conjoint 
analysis (C A) dengan subjek tunggal.Subjek ditanya untuk menilai 8 jenis 
permen coklat.adapun atribut permen coklat yaitu: dari segi bahan 
dasar,ada jenis coklat hitam atau coklat susu (dark/milk), dari segi isi 
tengah permen ada permen kenyal atau lembut ( chewy/soft ), dan 
terakhir dari segi ada tidaknya kacang dalam permen (nuts/no nuts). Skala 
penilaian dari 1-9, dengan 1 adalah pilihan yang paling tidak disukai 
hingga 9 adalah pillihan yang paling disukai.CA digunakan untuk 
menentukan atribut utama dan bagian penting dari suatu permen coklat. 
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Setelah pengumpulan, atribut dan data penilaian dimasukkan kedalam 
SAS data set. 

title'Preferensi permen coklat'; 
data cok; 

input coklat $ isi $ kacang $& rating; 
datalines; 

dark chewy nuts 7 
dark chewy no nuts 6 
dark soft nuts 6 
dark soft no nuts 4 
milk chewy nuts 9 
milk chewy no nuts 8 
milk soft nuts 9 
milk soft no nuts 7 


odsexclude notes mvanova anova; 
proctransregutilitiesseparators=', , short; 
title2'Metric Conjoint Analysis'; 

modelidentity(rating)=class(coklat isi kacang / zero=sum); 

run; 


dalam hal ini PROC TRANSREG digunakan dalam CA.output dari metrik 
CA dimunculkan oleh pernyataan utilitiespada pernyataan PROC 
.pernyataanseparators- , 1 mengakibatkan label terdiri dari nama variabel, 
koma, spasi lalu atribut dari variabel, kita menggunakan short option 
untuk menekan itrasi. Pernyataanodsexclude notes mvanova anova; 
adalah untukmengecualikan informasi ANOVA untuk menghemat output. 
Analisis variabel, transformasi dari masing masing variabel, transformasi 
dari pilihan tertantu dinyatakan dalam pernyataan model. 

Pernyataan identity(rating) meminta transformasi identitas dari variabel 
bebas respon “rating”. 
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Output 


The TRANSREG Procedure 


Dependent Variable Identity(rating) 
Class Level Information 
Class Levels Values 


coklat 

2 

dark milk 

isi 

2 

chewy soft 

kacang 

2 

no nuts nuts 


8 
8 

Identity(rating) 

Algorithm converged. 


Number of Observations Read 
Number of Observations Used 


The TRANSREG Procedure Hypothesis Tests for Identity(rating) 


Root MSE 

0.50000 

R-Square 

0.9500 

Dependent Mean 

7.00000 

Adj R-Sq 

0.9125 

Coeff Var 

7.14286 






The TRANSREG 

Procedure 


Utilities Table 

Based on the 

Usual Degrees 

of Freedom 

Importance 





Standard (% Utility Label 

Utility 

Error 

Range) Variable 

Intercept 

7.0000 

0.17678 


Intercept 

coklat, dark 

-1.2500 

0.17678 

50.000 

Class.coklatdark 

coklat, milk 

1.2500 

0.17678 


Class.coklatmilk 

isi, chewy 

0.5000 

0.17678 

20.000 

Class.isichewy 

isi, soft 

-0.5000 

0.17678 


Class.isisoft 

kacang, no nuts 

-0.7500 

0.17678 

30.000 

Class.kacangno_nuts 

kacang, nuts 

0.7500 

0.17678 


Class.kacangnuts 


Nampak dari output pernyataan Algorithm converged artinya tidak ada 
masalah dalam iterasi, nampak pula nilai R 2 =0.95. pada tabel terakhir 
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tabel Utilities menampilkan yang nilai kegunaan dari jenis permen, mulai 
dari yang paling banyak disukai hingga yang paling sedikit disukai.Nilai 
positif dalam kolom utility lebih disukai dibanding nilai negatifnya.Coklat 
milk lebih disukai dibanding coklat dark, isi chewy lebih disukai dibanding 
soft, kacang lebih disukai dibanding tanpa kacang. 

CA menyediakan sebuah perkiraan dekomposisi dari nilai rating awal. 
Perkiraaan nilai kegunaan (utility) dari sebuah permen adalah jumlah 
intercept dan part-worth utility. CA model untuk preferensi coklat tipe ke-i, 
isi ke-j, dan kacang ke-k. adalah 

yijk = M "k Pl i "k P2 j “k /?3fc "k ^ijk 

Sehingga untuk i =1,2; j=l ,2; k=l ,2; dengan 


Pil + P12 - p2 1 + P 22 - p3 1 + p32 ~ 0 


Part-worth Utilities untuk level dari atribut adalah nilai harapan parameter 
Pn>Pi2>p2i>p22>p3i>P32 ' adapun nilai harapan dari intercept adalah fi dan 
komponen galat adalah e ijk 

Nilai dugaan utility dari kombinasi ijk adalah 

S^ijk = P + Pli + p 2 j + P 3 k 

Sebagai contoh kombinasi yang paling disukai milk chewy nuts dapat 
diduga dengan nilai utility-nya. 

7,0+1,25+0,5+0,75=9,5= y * y = 9,0 

Dan yang kombinasi yang paling tidak dipilih adalah kombinasi dark soft 
no nuts, nilai dugaan utility dan nilai sebenarnya adalah sebagai berikut 

7,0 - 1,25 - 0,5 - 0,75 = 4,5 = y * y = 4,0 
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Nilai dugaan Utilities adalah nilai dugaaan regresi; kuadrat korelasi antara 
dugaan Utilities untuk setiap kombinasi dan nilai rating preference 
sebenarnya adalah R 2 . 

Kolom important dihitung dari jarak antar faktor (atribut) di kolom utility 
(part worth utility).Setiap jarak dikalikan 100 lalu dibagi jumlah dari semua 
jarak.Faktor yang memiliki jarak tertinggi adalah yang paling penting 
dalam menentukan preferensi. Namun ketika faktor memiliki level faktor 
yang beragam kadang kala dapan menaikkan nilai importence (lihat 
wittink, krishnamurthi, dan Reibstein, 1989). 

Dari nilai importance menunjukkan nampak bahwa type coklat, dengan 
nilai importance 50% adalah atribut yang paling penting dalam 
penentuan preferensi. 


100 x (1.25—1.25) 

(1.25— 1.25) + (0.5— 0.5) + (0.75— 0.75) “ ° 

Nilai kedua yang paling penting adalah permen yang berisi kacang, 
dengan nilai nilai importance 30% 

100 x (0.75—0.75) 

_2_ _ _ _ o n0 / 

(1.25— 1.25) + (0.5— 0.5) + (0.75— 0.75) “ 

Dan isi permen dengan nilai importance 20% adalah yang paling kecil 
nilai kepentingannya 


100 x (0.50—0.50) 

(1.25— 1.25) + (0.5— 0.5) + (0.75— 0.75) 


= 20 % 


408 



17.3.2. Non-Metric Conjoint Analysis 

Dalam contoh ini,PROC TRANSREG digunakan untuk melakukan analisis 
conjoint nonmetrik dari dataset permen coklat.perbedaannya terletak 
pada tranformasi variabel respon. dalam analisis conjoint nonmetrik 
menggunakan tranformasi monotone terhadap variabel rating. Juga kita 
tidak menggunakan option short sehingga kita dapat melihat tabel 
sejarah iterasi. Adapun pernyataan output digunakan agar nilai rating 
yang telah transformasikan tersimpan diluar output data set. 

odsexclude notes anova liberalanova conservanova 
mvanova liberalmvanova conservmvanova; 
proctransregutilitiesseparators- , 

title2'NonMetric Conjoint Analysis'; 

model monotone(rating)=class(coklat isi kacang / zero=sum); 

output; 

run; 


Analisis conjoint nonmetrik secara iteratif menurunkan tranformasi 
monotone dari variabel rating . 
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The TRANSREG Procedune 


Dependent Variable Monotone(nating) 


Class Level Information 


Class Levels Values 

coklat 2 dark milk 

isi 2 chewy soft 

kacang 2 no nuts nuts 


Number of Observations Read 8 

Number of Observations Used 8 


TRANSREG Univariate Algorithm Iteration History for Monotone(rating) 

Iteration Average Maximum Criterion 

Number Change Change R-Square Change Note 

fffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff 

1 0.08995 0.23179 0.95000 

2 0.01263 0.03113 0.96939 0.01939 

3 0.00345 0.00955 0.96981 0.00042 

4 0.00123 0.00423 0.96984 0.00003 

5 0.00050 0.00182 0.96985 0.00000 

6 0.00021 0.00078 0.96985 0.00000 

7 0.00009 0.00033 0.96985 0.00000 

8 0.00004 0.00014 0.96985 0.00000 

9 0.00002 0.00006 0.96985 0.00000 

10 0.00001 0.00003 0.96985 0.00000 Converged 

Algorithm converged. 
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The TRANSREG Procedure 


The TRANSREG Procedure Hypothesis Tests for Monotone(rating) 


Root MSE 0.38829 R-Square 0.9698 
Dependent Mean 7.00000 Adj R-Sq 0.9472 
Coeff Var 5.54699 


Utilities Table Based on the Usual Degrees of Freedom 



Label 


Utility 


Intercept 


7.0000 

coklat , 

dark 

-1.3143 

0.13728 

coklat , 

milk 

1.3143 

0.13728 

isi, chewy 

0.4564 

0.13728 

isi, soft 

-0.4564 

0.13728 

kacang. 

no nuts 

-0.6993 

0.13728 

kacang. 

nuts 

0.6993 

0.13728 



Importance 


Standard 

(% Utility 


Error 

Range) 

Variable 

0.13728 


Intercept 


53.209 Class.coklatdark 
Class.coklatmilk 


18.479 Class.isichewy 

Class.isisoft 

28.312 Class.kacangno_nuts 

Class.kacangnuts 


The Standard errors are not adjusted for the fact that the dependent 
variable was transformed and so are generally liberal (too small). 


Nilai R 2 naik dari 0.95 menjadi 0,969585 dalam kasus non metrik ini.nilai 
importance dan utility (part-worth utility hanya sedikit perbedaannya 
dibanding analisis metrik. Namun secara umum pola dari hasilnya relatif 
sama. 


Prosedur GPLOT selanjutnya digunakan untuk memplot tranformasi dari 

variabel rating. 

procsort; by rating; run; 
procgplot; 

title h=1.5'preferensi permen coklat'; 

title2 h=1'non metrik analsis conjoint'; 

plot trating * rating = 1 / framehaxis=axis2 vaxis=axisl ; 

symboll v=plus i=join; 

axislorder= (1 to 10 ) 

label =(angle=90 , tranformation variabel rating'; 
axis2order=(l to 9) label= ('original rating'); 

run; quit; 





dan diperoleh output: 


preferensi permen coklat 

non rret r i k anal si s conj oi nt 



Dalam hal ini.transformasihampir mendekati linear. Dalam kasus lain, nilai 
R 2 dapat naik lebih dari seperti dalam teladan ini. dan transformasi 
mungkin nampak dengan jelas nonlinear. 
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